Newsletter Subscribe
Enter your email address below and subscribe to our newsletter
Enter your email address below and subscribe to our newsletter

OpenAI-ის ChatGPT-ის მანიპულირება შესაძლებელია სექსუალიზებული და გრაფიკულად ძალადობრივი გამოსახულებების გენერირებისთვის, მხოლოდ ფართოდ გავრცელებულ მოთხოვნაში მცირე ცვლილებების შეტანით, ნათქვამია ბრიტანული AI უსაფრთხოების ფირმა Mindgard-ის მიერ ოთხშაბათს BBC-სთვის მიწოდებულ დასკვნებში.koha
აღმოჩენა ეხება OpenAI-ის GPT-5.4 მოდელს, ChatGPT-ის გამოსახულების გენერირების შესაძლებლობის უახლეს საჯარო ვერსიას. Mindgard-ის მკვლევარებმა დაადგინეს, რომ მოთხოვნის მოდიფიცირება, რომელიც თავდაპირველად იუმორისტული შედეგების მისაღებად იყო შექმნილი, სისტემას მაპროვოცირებელი კონტენტის გამოსატანად უბიძგებდა — ყოველგვარი პირდაპირი ინსტრუქციის გარეშე, რომელიც ძალადობრივ ან სექსუალურ თემატიკას მიუთითებდა.bbc
პიტერ გარაგანი, Mindgard-ის დამფუძნებელი, BBC-ს ეუბნება, რომ AI-მ „ავტონომიურად დააგენერირა მრავალი შოკისმომგვრელი და სექსუალიზებული ვიზუალი“, მიუხედავად იმისა, რომ მოთხოვნა გამოსახულებების შინაარსს არ განსაზღვრავდა. მან შედეგები დაახასიათა როგორც „ძალიან საზარელი, ზოგჯერ სექსუალური და ზოგჯერ ორივე ერთად“.koha
გენერირებულ გამოსახულებებს შორის იყო თავის არეში დაჭრილი მამაკაცის, სისხლიანი სხეულის მქონე გარდაცვლილი ქალის გამოსახულებები და სცენები, რომლებიც სექსუალურ ძალადობას სიშიშვლესთან აერთიანებდა. Mindgard-ის უფრო ადრეულმა გამჟღავნებამ, რომელიც თებერვალში გამოქვეყნდა, აღნიშნა, რომ ტექნიკას ასევე შეეძლო რეალური ადამიანების სექსუალიზებული გამოსახულებების შექმნა — რაც არათანხმობიან deepfake-ებთან დაკავშირებით შეშფოთებას იწვევს.bbc
მას შემდეგ, რაც BBC-მ OpenAI-ს მიმართა აღმოჩენებთან დაკავშირებით, კომპანიამ განაცხადა, რომ ზომები მიიღო. „ამ ფენომენის გამოძიების შემდეგ, ჩვენ დავაწესეთ დამატებითი დამცავი ზომები ამ ტიპის ინსტრუქციების წინააღმდეგ“, — განაცხადა OpenAI-მ. კომპანიამ დაამატა, რომ ის ინარჩუნებს დაცვის მრავალ ფენას, რათა მომხმარებლებს ხელი შეუშალოს ისეთი კონტენტის შექმნაში, რომელიც მის პოლიტიკას არღვევს.bbc
თუმცა, AI უსაფრთხოების მკვლევარებმა BBC-ს განუცხადეს, რომ მხოლოდ მცირე ვარიაციებით, პრობლემური მოთხოვნა კვლავ აგრძელებდა შემაშფოთებელი შედეგების წარმოებას OpenAI-ის ჩარევის შემდეგაც.koha
Mindgard-ის ტექნიკურმა ბლოგმა, რომელიც თებერვალში გამოქვეყნდა, დეტალურად აღწერა, თუ როგორ მუშაობდა გვერდის ავლის მეთოდი: მკვლევარებმა მანიპულირება მოახდინეს ChatGPT-ის მორგებულ მეხსიერებასა და სისტემური მოთხოვნის კონტექსტზე, რათა მისი გამოსახულების უსაფრთხოების ბარიერები გადაეწერათ, რაც არ საჭიროებდა ბექენდზე წვდომას ან სპეციალურ ავტორიზაციას. მოწყვლადობა პირველად 1 იანვარს აღმოაჩინეს და 28 იანვარს OpenAI-ს შეატყობინეს.mindgard
აღმოჩენები AI გამოსახულების გენერირების უსაფრთხოების ფართო შემოწმების ფონზე ხდება. OpenAI-ს ცალკე მოუწია კითხვებზე პასუხის გაცემა ChatGPT-ისთვის დაგეგმილი „ზრდასრულთა რეჟიმის“ (Adult Mode) ფუნქციის შესახებ, რომელიც კომპანიამ ამ წლის დასაწყისში გადადო მას შემდეგ, რაც შიდა უსაფრთხოების მრჩევლებმა გააფრთხილეს, რომ ამან შესაძლოა არასრულწლოვნები საფრთხის ქვეშ დააყენოს. BBC-ს კვლევაში გამოყენებული კონკრეტული მოთხოვნები არ გამოუქვეყნებია.mashable