SpaceX აშენებს AI წვრთნის სისტემას C ენაზე 220,000 GPU-სთვის

SpaceX-მა თითქმის დაასრულა C ენაზე დაწერილი მორგებული AI წვრთნის სტეკი, რომელიც განკუთვნილია 220,000 Nvidia ↗2.95% GB300 ამაჩქარებლისთვის 800G ქსელით.gagadget
Elon Musk-მა განაცხადა, რომ სისტემა გააძლიერებს Grok v5-ს xAI-სთვის, რომელიც წელს SpaceX-ს შეუერთდა და უკვე ავარჯიშებს მოდელებს 10 ტრილიონ პარამეტრამდე.kingy
Google ↗1.48%-ის JAX ჩარჩოსთან შედარებით ათჯერადი სიჩქარის უპირატესობა ჯერ არ არის დადასტურებული, დამოუკიდებელი ტესტები ჯერ არ გამოქვეყნებულა.gagadget

SpaceX აშენებს მორგებულ C-ზე დაფუძნებულ AI წვრთნის სტეკს 220,000-GPU კლასტერისთვის

SpaceX-მა თითქმის დაასრულა მორგებული AI წვრთნის სისტემა, რომელიც დაწერილია C პროგრამირების ენაზე და განკუთვნილია 220,000 Nvidia GB300 ამაჩქარებლის კლასტერზე გასაშვებად, რომლებიც დაკავშირებულია 800G ქსელით. Elon Musk-მა პროექტის შესახებ 28 მაისს X-ზე განაცხადა და განაცხადა, რომ სისტემას შეუძლია დიდი წვრთნის გაშვებებისთვის Google-ის JAX ჩარჩოზე 10-ჯერ მეტი სიჩქარის მიწოდება.gagadget

Bare-Metal მიდგომა

„SpaceX-მა თითქმის დაასრულა შიდა AI წვრთნის სტეკის V1.0-ის წერა C ენაზე, რომელიც ზუსტად ერგება 220 ათას GB300-ს 800G NIC-ებით, ფართოდ იყენებს კონვეიერულ პარალელიზმს და მაქსიმალურად უახლოვდება bare metal-ს,“ დაწერა Musk-მა X-ზე.x

ეს მიდგომა ინდუსტრიული ნორმებიდან გადახვევას წარმოადგენს. AI ლაბორატორიების უმეტესობა მოდელებს ავარჯიშებს ისეთ ჩარჩოებზე, როგორიცაა JAX ან Meta-ს PyTorch, რომლებიც იყენებენ Python-ზე დაფუძნებულ აბსტრაქციის ფენებს განვითარების სიმარტივისთვის. პირდაპირ C ენაზე წერა გამორიცხავს ამ შუალედურ პროგრამულ ფენებს, რაც კოდს საშუალებას აძლევს უფრო პირდაპირ ურთიერთქმედებდეს აპარატურასთან — მაგრამ განვითარების მოქნილობის ხარჯზე.gagadget

თითოეული Nvidia GB300 NVL72 თარო შეიცავს 72 Blackwell Ultra GPU-ს და 36 Grace CPU-ს, 800 Gb/s ქსელით თითო GPU-ზე. 220,000 ამაჩქარებლით, კლასტერი დღემდე გამოცხადებულ AI წვრთნის უდიდეს ინსტალაციებს შორისაა. სტეკი დიდად ეყრდნობა კონვეიერულ პარალელიზმს, ტექნიკას მოდელის წვრთნის ათასობით ჩიპზე ერთდროულად გასაყოფად, სადაც კომუნიკაციის შეყოვნების მინიმიზაცია კრიტიკულია შესრულებისთვის.basenor

Grok და xAI ინტეგრაცია

Musk-მა დაადასტურა, რომ ახალი წვრთნის სტეკი გააძლიერებს Grok v5-ს, xAI-ს შემდეგ მთავარ მოდელის გამოშვებას. სისტემის განვითარება მოხდა მას შემდეგ, რაც xAI 2026 წლის თებერვალში SpaceX-ს შეუერთდა, რითაც გააერთიანა AI მოდელი, წვრთნის აპარატურა და პროგრამული უზრუნველყოფა ერთი სუბიექტის ქვეშ.kingy

SpaceX-ის Colossus 2 კლასტერი უკვე ავარჯიშებს შვიდ მოდელს პარალელურად, მათ შორის ვარიანტებს, რომლებიც Grok 5-ისთვის 10 ტრილიონ პარამეტრამდე ადის. მორგებული C სტეკი, როგორც ჩანს, მიზნად ისახავს ამ ძალისხმევის კიდევ უფრო დაჩქარებას.basenor

დაუდასტურებელი განცხადებები

JAX-თან შედარებით 10-ჯერადი სიჩქარის განცხადება დამოუკიდებელი ტესტებით ჯერ არ არის დადასტურებული. თავად JAX ფლობს მრავალ MLPerf რეკორდს და SpaceX-ის სისტემის მესამე მხარის ტესტირება არ გამოქვეყნებულა. სტეკის საკუთრების ხასიათი ასევე აჩენს კითხვებს აუდიტებადობის შესახებ — ღია ჩარჩოებისგან განსხვავებით, დახურული სისტემის ბენჩმარკინგი ან მასზე დაშენება გარე მკვლევრებისთვის უფრო რთულია.gagadget

SpaceX შედის დომენში, სადაც Google, Microsoft და Meta წლებია აუმჯობესებენ წვრთნის ინფრასტრუქტურას. დაინახავენ თუ არა bare-metal მიდგომის დაპირებულ სარგებელს მასშტაბურად, ჯერ კიდევ გასარკვევია.