Newsletter Subscribe
Enter your email address below and subscribe to our newsletter
Enter your email address below and subscribe to our newsletter

Nvidia-მ კვირას GTC Taipei-ზე წარადგინა Cosmos 3, რითაც გამოუშვა მსოფლიოში პირველი სრულად ღია ომნიმოდელი ფიზიკური AI-სთვის — ერთიანი სისტემა, რომელიც აერთიანებს ხედვის მსჯელობას, სამყაროს გენერირებას და მოქმედების პროგნოზირებას, რათა დაეხმაროს რობოტებსა და ავტონომიურ მანქანებს აღიქვან და იმოქმედონ რეალურ სამყაროში.
ტრანსფორმერების ნარევის არქიტექტურაზე აგებული Cosmos 3 აერთიანებს მსჯელობის ტრანსფორმერს ექსპერტული გენერირების ტრანსფორმერთან, რაც მოდელს საშუალებას აძლევს გაიგოს ობიექტების ურთიერთქმედება, მოძრაობა და სივრცულ-დროითი კავშირები ვიდეოსა და მოქმედების ტრაექტორიების გენერირებამდე. სისტემას შეუძლია მშობლიურად დაამუშაოს და შექმნას ტექსტი, გამოსახულებები, ვიდეო, გარემოს ხმა და მოქმედებები — რაც დეველოპერებს უხსნის საჭიროებას, გამოიყენონ ცალკეული მოდელები სხვადასხვა შესაძლებლობებისთვის.globenewswire
„ფიზიკური AI-ს დიდი აფეთქება ახლოსაა მულტიმოდალური მსჯელობის ენის, ხედვისა და სამყაროს მოდელების მიღწევების წყალობით“, – განაცხადა Jensen Huang-მა, Nvidia-ს დამფუძნებელმა და აღმასრულებელმა დირექტორმა, თავისი გამოსვლისას. „Cosmos 3-ის ღია, სასაზღვრო ომნიმოდელების ოჯახი დეველოპერებს აძლევს თაობათა ნახტომს რობოტების, ავტონომიური მანქანებისა და ხედვის AI-ს შესაქმნელად, რომლებიც აღიქვამენ, მსჯელობენ, გეგმავენ და მოქმედებენ ფიზიკურ სამყაროში.“globenewswire
გამოშვება მოიცავს მოდელის ორ ზომას: Cosmos 3 Nano, 8-მილიარდ-პარამეტრიანი ვერსია, რომელიც შექმნილია სამუშაო სადგურის დონის აპარატურაზე, როგორიცაა RTX PRO 6000 GPU, და Cosmos 3 Super, 32-მილიარდ-პარამეტრიანი მოდელი, რომელიც აგებულია Hopper და Blackwell GPU-ებზე მასშტაბური სინთეზური მონაცემების გენერირებისთვის. მესამე ვარიანტი, Cosmos 3 Edge, მალე გამოვა რეალურ დროში დასკვნების გამოსატანად.huggingface
Nvidia მოდელებს, პოსტ-წვრთნის სკრიპტებსა და სინთეზური მონაცემების გენერირების ნაკრებებს ღია წყაროს სახით ავრცელებს, რაც მათ ხელმისაწვდომს ხდის Hugging Face-სა და GitHub-ზე. დეველოპერებს ასევე შეუძლიათ მოდელების დანერგვა Nvidia NIM მიკროსერვისების სახით ან მათზე წვდომა ღრუბლოვანი პარტნიორების მეშვეობით, მათ შორის Microsoft Azure, CoreWeave და Nebius.huggingface
გაშვებასთან ერთად, Nvidia-მ გამოაცხადა Cosmos Coalition, თანამშრომლობა Agile Robots-თან, Black Forest Labs-თან, Generalist-თან, LTX-თან, Runway-სა და Skild AI-სთან ღია სამყაროს მოდელების წინსვლისთვის. ფიზიკური AI-ს დეველოპერებს შორის, რომლებიც უკვე აშენებენ პლატფორმაზე, არიან Samsung, LG Electronics, Doosan Robotics და Li Auto.globenewswire
ღია მოდელებს შორის Cosmos 3 პირველ ადგილზეა ფიზიკური AI-ს მრავალ ტესტში, მათ შორის Physics-IQ და PAI-Bench სამყაროს გენერირების სიზუსტისთვის, RoboLab და RoboArena მოქმედების პოლიტიკისთვის, და VANTAGE-Bench და TAR ლიდერბორდები ხედვის გაგებისთვის. მოდელი შექმნილია ფიზიკური AI-ს წვრთნის ციკლების თვეებიდან დღეებამდე შესამცირებლად, წინასწარ გაწვრთნილი ფუნდამენტის მიწოდებით, რომელიც მოითხოვს ნაკლებ მონაცემებს და დაბალ წვრთნის ხარჯებს.huggingface