Enter your email address below and subscribe to our newsletter

Nvidia-მ გამოუშვა Nemotron 3 Ultra, მისი ყველაზე დიდი ღია AI მოდელი

Share your love

  • Nvidia 2.95%-მ ოთხშაბათს გამოუშვა Nemotron 3 Ultra, ჰიბრიდული Transformer-Mamba მოდელი 1 მილიონი ტოკენის კონტექსტით აგენტური მსჯელობისთვის.lmsys
  • Nvidia-ს ცნობით, მოდელი უზრუნველყოფს 5-ჯერ უფრო სწრაფ ინფერენსს, ვიდრე მსგავსი ღია მოდელები და Artificial Analysis-ის რეიტინგებში აშშ-ის ღია წონის მოდელებს შორის პირველ ადგილს იკავებს.artificialanalysis
  • კორპორატიული პარტნიორები, მათ შორის Glean, CrowdStrike და Palantir Technologies 1.65%, მოდელს კიბერუსაფრთხოების, ცოდნაზე დაფუძნებული მუშაობისა და აგენტური სამუშაო პროცესებისთვის ნერგავენ.nvidia

Nvidia-მ გამოუშვა Nemotron 3 Ultra, 550-მილიარდიანი პარამეტრის მქონე ღია მოდელი აგენტური AI-სთვის

ოთხშაბათს Nvidia-მ გამოუშვა Nemotron 3 Ultra, მისი დღემდე ყველაზე დიდი ღია წონის AI მოდელი, რითაც დაასრულა Nemotron 3-ის ოჯახი, რომელიც პირველად 2025 წლის დეკემბერში დაანონსდა. 550-მილიარდიანი პარამეტრის მქონე Mixture-of-Experts მოდელი თითო ტოკენზე 55 მილიარდ პარამეტრს ააქტიურებს და შექმნილია გრძელვადიანი ავტონომიური AI აგენტების გასაძლიერებლად კოდირების, კვლევისა და კორპორატიული სამუშაო პროცესების სფეროში.lmsys

მოდელი ხელმისაწვდომი გახდა 4 ივნისს Hugging Face-ის, ModelScope-ის, OpenRouter-ისა და Nvidia-ს build.nvidia.com პლატფორმის მეშვეობით, როგორც NIM მიკროსერვისი, მას შემდეგ, რაც ის CEO-მ Jensen Huang-მა 31 მაისს GTC Taipei-ზე წარადგინა.nvidia

არქიტექტურა და წარმადობა

Nemotron 3 Ultra იყენებს ჰიბრიდულ Transformer-Mamba არქიტექტურას, რომელიც აერთიანებს ტრადიციულ ყურადღების მექანიზმებს გრძელი მიმდევრობებისთვის ოპტიმიზებულ სახელმწიფო-სივრცულ მოდელებთან. დიზაინი მხარს უჭერს 1 მილიონამდე ტოკენის კონტექსტურ ფანჯარას, რაც აგენტებს საშუალებას აძლევს შეინარჩუნონ მსჯელობის თანმიმდევრულობა ხანგრძლივი, მრავალეტაპიანი ამოცანების შესრულებისას.youtube

Nvidia აცხადებს, რომ მოდელი უზრუნველყოფს 5-ჯერ უფრო სწრაფ ინფერენსს და 30%-ით დაბალ ხარჯებს თავისი კლასის სხვა ღია მოდელებთან შედარებით. საანალიზო პლატფორმა Artificial Analysis-ის მიხედვით, Nemotron 3 Ultra-ს Intelligence Index-ზე 48 ქულა აქვს, რაც მას აშშ-ის ლაბორატორიების ყველაზე შესაძლებლობების მქონე ღია წონის მოდელად აქცევს, თუმცა ის ჯერ კიდევ ჩამორჩება ზოგიერთ ჩინურ კონკურენტს.artificialanalysis

მოდელი გაწვრთნილია მრავალგარემოებიანი განმტკიცებითი სწავლებით (reinforcement learning) და ოპტიმიზებულია ისეთი აგენტური პლატფორმებისთვის, როგორიცაა Hermes Agent, LangChain Deep Agents, OpenHands და OpenCode.lmsys

კორპორატიული დანერგვა და ეკოსისტემა

გამოშვებას თან ახლდა კორპორატიული ინტეგრაციების ტალღა. Glean-მა გამოაცხადა Nemotron 3 Ultra-ს მხარდაჭერა და აღნიშნა, რომ მოდელი უზრუნველყოფს „სასაზღვრო მოდელების წარმადობის 91%-ს“ ყოველდღიური კორპორატიული აგენტური სამუშაოსთვის. Aible, CrowdStrike და Palantir ასევე ნერგავენ Nemotron-ის მოდელებს თავიანთ პლატფორმებში ცოდნაზე დაფუძნებული მუშაობის, კიბერუსაფრთხოებისა და ოპერატიული გადაწყვეტილებების მისაღებად.x

SGLang-მა და Miles-მა გამოაცხადეს ინფერენსის მხარდაჭერა, რაც დეველოპერებს აძლევს მაღალი წარმადობის სერვერულ სტეკს Blackwell GPU-ებზე, როგორც BF16, ისე NVFP4 სიზუსტით. Amazon Web Services-მა მანამდე უკვე გახადა Nemotron 3-ის ოჯახის სხვა მოდელები ხელმისაწვდომი SageMaker JumpStart-ზე ერთი დაწკაპუნებით დანერგვის შესაძლებლობით.amazon

ეს გამოშვება Nvidia-ს პოზიციონირებს არა მხოლოდ როგორც AI აპარატურის დომინანტ მომწოდებელს, არამედ როგორც მოდელების მზარდად კონკურენტუნარიან შემქმნელს. „მსოფლიოს პროგრამული უზრუნველყოფის ლიდერები ნერგავენ AI აგენტებს სისტემებში, სადაც სამუშაო სრულდება“, – თქვა Huang-მა GTC Taipei-ზე და აგენტები დაახასიათა როგორც „ციფრული თანამშრომლები“, რომლებიც „აძლიერებენ ადამიანურ ექსპერტიზას“.nvidia

Leave a Reply

თქვენი ელფოსტის მისამართი გამოქვეყნებული არ იქნება. სავალდებულო ველების მონიშვნის ნიშანი *

Stay informed and not overwhelmed, subscribe now!