Newsletter Subscribe
Enter your email address below and subscribe to our newsletter
Enter your email address below and subscribe to our newsletter

ოთხშაბათს Nvidia-მ გამოუშვა Nemotron 3 Ultra, მისი დღემდე ყველაზე დიდი ღია წონის AI მოდელი, რითაც დაასრულა Nemotron 3-ის ოჯახი, რომელიც პირველად 2025 წლის დეკემბერში დაანონსდა. 550-მილიარდიანი პარამეტრის მქონე Mixture-of-Experts მოდელი თითო ტოკენზე 55 მილიარდ პარამეტრს ააქტიურებს და შექმნილია გრძელვადიანი ავტონომიური AI აგენტების გასაძლიერებლად კოდირების, კვლევისა და კორპორატიული სამუშაო პროცესების სფეროში.lmsys
მოდელი ხელმისაწვდომი გახდა 4 ივნისს Hugging Face-ის, ModelScope-ის, OpenRouter-ისა და Nvidia-ს build.nvidia.com პლატფორმის მეშვეობით, როგორც NIM მიკროსერვისი, მას შემდეგ, რაც ის CEO-მ Jensen Huang-მა 31 მაისს GTC Taipei-ზე წარადგინა.nvidia
Nemotron 3 Ultra იყენებს ჰიბრიდულ Transformer-Mamba არქიტექტურას, რომელიც აერთიანებს ტრადიციულ ყურადღების მექანიზმებს გრძელი მიმდევრობებისთვის ოპტიმიზებულ სახელმწიფო-სივრცულ მოდელებთან. დიზაინი მხარს უჭერს 1 მილიონამდე ტოკენის კონტექსტურ ფანჯარას, რაც აგენტებს საშუალებას აძლევს შეინარჩუნონ მსჯელობის თანმიმდევრულობა ხანგრძლივი, მრავალეტაპიანი ამოცანების შესრულებისას.youtube
Nvidia აცხადებს, რომ მოდელი უზრუნველყოფს 5-ჯერ უფრო სწრაფ ინფერენსს და 30%-ით დაბალ ხარჯებს თავისი კლასის სხვა ღია მოდელებთან შედარებით. საანალიზო პლატფორმა Artificial Analysis-ის მიხედვით, Nemotron 3 Ultra-ს Intelligence Index-ზე 48 ქულა აქვს, რაც მას აშშ-ის ლაბორატორიების ყველაზე შესაძლებლობების მქონე ღია წონის მოდელად აქცევს, თუმცა ის ჯერ კიდევ ჩამორჩება ზოგიერთ ჩინურ კონკურენტს.artificialanalysis
მოდელი გაწვრთნილია მრავალგარემოებიანი განმტკიცებითი სწავლებით (reinforcement learning) და ოპტიმიზებულია ისეთი აგენტური პლატფორმებისთვის, როგორიცაა Hermes Agent, LangChain Deep Agents, OpenHands და OpenCode.lmsys
გამოშვებას თან ახლდა კორპორატიული ინტეგრაციების ტალღა. Glean-მა გამოაცხადა Nemotron 3 Ultra-ს მხარდაჭერა და აღნიშნა, რომ მოდელი უზრუნველყოფს „სასაზღვრო მოდელების წარმადობის 91%-ს“ ყოველდღიური კორპორატიული აგენტური სამუშაოსთვის. Aible, CrowdStrike და Palantir ასევე ნერგავენ Nemotron-ის მოდელებს თავიანთ პლატფორმებში ცოდნაზე დაფუძნებული მუშაობის, კიბერუსაფრთხოებისა და ოპერატიული გადაწყვეტილებების მისაღებად.x
SGLang-მა და Miles-მა გამოაცხადეს ინფერენსის მხარდაჭერა, რაც დეველოპერებს აძლევს მაღალი წარმადობის სერვერულ სტეკს Blackwell GPU-ებზე, როგორც BF16, ისე NVFP4 სიზუსტით. Amazon Web Services-მა მანამდე უკვე გახადა Nemotron 3-ის ოჯახის სხვა მოდელები ხელმისაწვდომი SageMaker JumpStart-ზე ერთი დაწკაპუნებით დანერგვის შესაძლებლობით.amazon
ეს გამოშვება Nvidia-ს პოზიციონირებს არა მხოლოდ როგორც AI აპარატურის დომინანტ მომწოდებელს, არამედ როგორც მოდელების მზარდად კონკურენტუნარიან შემქმნელს. „მსოფლიოს პროგრამული უზრუნველყოფის ლიდერები ნერგავენ AI აგენტებს სისტემებში, სადაც სამუშაო სრულდება“, – თქვა Huang-მა GTC Taipei-ზე და აგენტები დაახასიათა როგორც „ციფრული თანამშრომლები“, რომლებიც „აძლიერებენ ადამიანურ ექსპერტიზას“.nvidia