پیام خوزستان | مدل‌های هوش مصنوعی «اوپن‌ای‌آی» درباره حفظ ایمنی خود فکر می‌کنند

مدل‌های هوش مصنوعی «اوپن‌ای‌آی» درباره حفظ ایمنی خود فکر می‌کنند علمي

بزرگنمايي:

پیام خوزستان - ایسنا /ادعای جدید «اوپن‌ای‌آی» نشان می‌دهد که این شرکت، مدل‌های هوش مصنوعی o1 و o3 را آموزش داده است تا درباره خط مشی ایمنی خود فکر کنند.
شرکت «اوپن‌ای‌آی»(OpenAI) در روز جمعه خانواده جدیدی را از مدل‌های هوش مصنوعی استدلالی معرفی کرد. این استارت‌آپ ادعا می‌کند که مدل موسوم به o3 از مدل o1 و سایر مدل‌های منتشرشده، پیشرفته‌تر است. به نظر می‌رسد این پیشرفت‌ها از مقیاس‌بندی محاسبات زمان آزمایش به دست آمده‌اند اما اوپن‌ای‌آی می‌گوید از یک پارادایم جدید ایمنی برای آموزش مدل‌های سری o خود استفاده کرده است.
به نقل از تک‌کرانچ، اوپن‌ای‌آی روز جمعه پژوهش جدیدی را درباره «هم‌ترازی مشورتی» منتشر کرد و آخرین راه خود را برای اطمینان از هم‌ترازی مدل‌های هوش مصنوعی استدلالی با ارزش‌های توسعه‌دهندگان انسانی آنها شرح داد. اوپن‌ای‌آی از این روش استفاده کرد تا o1 و o3 را وادارد که درباره خط ‌مشی ایمنی خود در طول استنتاج -مرحله‌ای که کاربر دکمه enter را فشار می‌دهد- فکر کنند.
پژوهش اوپن‌ای‌آی نشان می‌دهد که این روش، هم‌ترازی کلی O1 را با اصول ایمنی شرکت بهبود بخشیده است. این بدان معناست که هم‌ترازی مشورتی، میزان پاسخ دادن به پرسش‌های ناامن را -حداقل پرسش‌هایی که توسط اوپن‌ای‌آی ناایمن تلقی می‌شوند- کاهش داده و در عین حال، توانایی خود را برای پاسخ دادن به پرسش‌های بی‌خطر بهبود بخشیده است.
با افزایش محبوبیت و قدرت مدل‌های هوش مصنوعی، پژوهش درباره ایمنی هوش مصنوعی بسیار مرتبط به نظر می‌رسد اما در عین حال، بسیار بحث‌برانگیز است. «دیوید ساکس»(David Sacks) کارآفرین و سرمایه‌گذار شرکت‌های فناوری، «ایلان ماسک»(Elon Musk) مدیرعامل شرکت‌های «اسپیس‌ایکس»(SpaceX) و «تسلا»(Tesla) و «مارک اندریسن»(Marc Andreessen) کارآفرین، سرمایه‌گذار و مهندس نرم‌افزار آمریکایی می‌گویند که برخی از اقدامات صورت‌گرفته برای ایمنی هوش مصنوعی در واقع سانسور هستند و ماهیت ذهنی این تصمیم‌ها را برجسته می‌کنند.
اگرچه مجموعه مدل‌های هوش مصنوعی اوپن‌ای‌آی از طرز فکر انسان‌ها پیش از پاسخ دادن به پرسش‌های دشوار الهام گرفته شده‌اند اما آنها واقعا مانند انسان‌ها فکر نمی‌کنند. با وجود این، نمی‌توان مردم را به خاطر باور کردن آنها سرزنش کرد؛ به ویژه به این دلیل که اوپن‌ای‌آی از واژه‌هایی مانند استدلال و تدبیر برای توصیف این فرآیندها استفاده می‌کند. مدل‌های o1 و o3 پاسخ‌های پیچیده‌ای را به وظایف نوشتن و کدنویسی ارائه می‌دهند اما آنها در پیش‌بینی نشانه بعدی در یک جمله عالی عمل می‌کنند.
نحوه عملکرد o1 و o3 به زبان ساده این طور است. پس از این که کاربر دکمه enter را در «چت‌جی‌پی‌تی»(ChatGPT) می‌زند، از پنج ثانیه تا چند دقیقه طول می‌کشد تا مدل‌های استدلالی اوپن‌ای‌آی دوباره پرسش‌های بعدی را مطرح کنند. مدل، مشکل را به مراحل کوچک‌تر تقسیم می‌کند. پس از این فرآیند که اوپن‌ای‌آی از آن به عنوان زنجیره فکر یاد می‌کند، سری o مدل‌ها براساس اطلاعاتی که تولید کرده‌اند، پاسخ می‌دهند.
نوآوری کلیدی در مورد هم‌ترازی مشورتی این است که اوپن‌ای‌آی، o1 و o3 را آموزش داده است تا در طول مرحله زنجیره فکر، متن خط مشی ایمنی شرکت را مجددا به خود بفرستند. پژوهشگران می‌گویند که این امر باعث شد تا o1 و o3 با خط مشی اوپن‌ای‌آی هماهنگی بیشتری داشته باشند اما در اجرای آن بدون کاهش تأخیر با مشکل روبه‌رو شدند.
پس از یادآوری مشخصات ایمنی مناسب، سری مدل‌های o نحوه پاسخ‌گویی ایمن به یک پرسش را بررسی می‌کنند. در یکی از آزمایش‌های اوپن‌ای‌آی، کاربر از مدل هوش مصنوعی استدلالی پرسید که چگونه یک پلاکارد واقعی پارک کردن را مخصوص افراد مبتلا به معلولیت درست کند. مدل در زنجیره فکری خود، به خط مشی اوپن‌ای‌آی مراجعه و مشخص کرد که کاربر برای جعل چیزی درخواست اطلاعات می‌کند. مدل در پاسخ به این درخواست، عذرخواهی کرد و هیچ کمکی را ارائه نداد.
به طور سنتی، بیشتر کارهای ایمنی هوش مصنوعی در مرحله پیش و پس از آموزش انجام می‌شود، نه در طول استنتاج. این موضوع، هم‌ترازی را به یک امر بدیع تبدیل می‌کند و اوپن‌ای‌آی می‌گوید که به o1-preview ، o1 و o3-mini کمک کرده است تا به برخی از امن‌ترین مدل‌های شرکت تبدیل شوند.
ایمنی هوش مصنوعی می‌تواند معانی بسیاری داشته باشد اما در این مورد، اوپن‌ای‌آی در تلاش است تا پاسخ‌ مدل‌های هوش مصنوعی خود را به درخواست‌های ناامن تعدیل کند. این درخواست‌ها ممکن است شامل درخواست از چت‌جی‌پی‌تی برای کمک به ساختن بمب، تهیه مواد مخدر یا نحوه ارتکاب جنایت باشد. برخی از مدل‌ها بدون تردید به این درخواست‌ها پاسخ می‌دهند اما اوپن‌ای‌آی نمی‌خواهد مدل‌های هوش مصنوعی آن چنین درخواست‌هایی را برآورده کنند.

دوشنبه ۳ دي ۱۴۰۳ - ۱۳:۵۱:۴۹
۳۷ بازديد
پیام خوزستان

https://www.payamekhuzestan.ir/Fa/News/1011510/

عبدی: تندرو‌ها به شدت از رفع فیلترینگ و آزادی مردم می‌ترسند

خوزستان؛ مقصد سفر استانی بعدی رئیس‌ جمهور

پیش بینی وضعیت جوی، دریایی و دمایی هرمزگان در روز 6 دی

وضعیت قرمز آلودگی هوا در خوزستان

آخرين مطالب

مدل‌های هوش مصنوعی «اوپن‌ای‌آی» درباره حفظ ایمنی خود فکر می‌کنند علمي

نظرات شما

ساير مطالب

بوژوویچ و استقلال همچنان یقه بزرگان را می‌گیرند

هدف آمریکا و رژیم صهیونیستی، تضعیف روحیه محور مقاومت است

رشد ترانزیت در بندرامام/ 37 میلیون تن کالا در بنادر خوزستان تخلیه و بارگیری شد

سه گام احیای بازدارندگی ایران / محور مقاومت توان بازیابی قدرت پیشین را دارد؟

بودجه فرهنگی اکثر ارگان‌ها صرف نصب چند بنر می‌شود!

دو امتیاز مهم را از دست رفت / دربی خوزستان برنده نداشت | اخبار ورزشی

صلاح: حس متفاوتی دارم، وقت قهرمانی است!

اتمام حجت موسیمانه با مهاجمان استقلال!

مدافعان بیشتر از گلرها توپ گرفتند!

برزیل ایران خوراک حسینی برای کلین‌شیت

اولین محک پرسپولیس با سرمربی جدید در قلعه با خیبر

ابراهیمی: حضور باقری در پرسپولیس از مربی خارجی بهتر است

ترکیب احتمالی پرسپولیس برای دیدار با خیبر در هفته چهاردهم لیگ برتر

تراکتور و سپاهان در اندیشه تصاحب صدر جدول

مدافع ملی‌پوش ناجی تیم یحیی (عکس)

یک استقلالی دیگر سرمربی هوادار شد – خبرگزاری ورزش ایران

کشتی فرنگی قهرمانی کشور؛ نفرات برتر 5 وزن نخست مشخص شدند | اخبار ورزشی

تاکید سخنگوی انصارالله یمن بر ادامه حمایت از مقاومت فلسطین

نشانه های هولناک آخرالزمان/ جنگ بزرگ در دمشق و یمن/ زلزله بزرگ در سوریه/ ویدئو

تمجید معاون وزیر از وزنه‌برداری/اسبقیان:تیم مدیریتی انوشیروانی دارند تلاش زیادی می‌کنند/این آینده روشن است – خبرگزاری ورزش ایران

اسکوربرد ورزشگاه غدیر در خواب زمستانی!

دو غایب کلیدی استقلال خوزستان در هفته آخر

آزاد سازی 38 هکتار از اراضی کشاورزی در بستان آباد

تصاویر/ هفته چهاردهم لیگ برتر فوتبال ایران، استقلال خوزستان - فولاد خوزستان

ارائه تسهیلات بانکی در خوزستان 18 درصد کمتر از میانگین کشوری

طرح مرخصی زندانیان مددجو؛ فرصتی برای بازگشت به کانون خانواده و جامعه

تمدید یامال با بارسا؛ قطعی در زمان نامعلوم!

کول پالمر: سه فرد مشهور برای قرار شام کریسمس؟

مدارس تهران هفته آینده تعطیل خواهد شد؟+ هواشناسی ایران در هفته آینده

گل‌محمدی استقلال را با خاک یکسان کرد!

برترین گل‌های سال 2024

خلاصه بازی لیورپول 3 - لسترسیتی 1

محمد سنوار؛ گزینه رهبری حماس و معمار مقاومت فلسطین کیست؟

عصبانیت هواداران لیورپول؛ مه نگذاشت بازی را ببینیم!

کشته شدن برادر ناتنی اندریک در یک حمله مسلحانه

رد گل سوم لیورپول به لسترسیتی توسط VAR

ضربه دیدنی صلاح؛ گل سوم لیورپول به لسترسیتی

درگیری شدید در بازی کیا - پرسپولیس

شوت فنی خاکپو؛ گل اول لیورپول به لسترسیتی

تصویر دلگرم‌کننده میلاد محمدی علیه ویروس!

از گل آزمون تا پاس گل طارمی؛ عملکرد لژیونرها در هفته اخیر

گل دوم لیورپول به لسترسیتی توسط کورتیس جونز در دقیقه 49

گل اول لیورپول به لسترسیتی توسط کودی گاکپو در دقیقه 45

آخرین تغییرات در حزب اتحاد ملت؛ پسر رئیس جمهور سابق عضو شورای مرکزی شد

اتهام‌پراکنی اتحادیه عرب علیه مواضع ایران پیرامون سوریه

پزشکیان، خراسان شمالی را ترک کرد

آملی لاریجانی: عده‌ای احساس کردند باید هر لحظه طعنه‌ای بزنند، این از خطا‌های جاهلین است

جزییات هولناک از آتش‌سوزی در پالایشگاه آبادان

کنایه سنگین سرمربی استقلال به یحیی گل‌محمدی

کشتی فرنگی قهرمانی کشور| فینالیست‌های 5 وزن دوم مشخص شدند

تبليغات