«این امروزی از سری نامههای خبری هفته که دوزنهایایله هر روز تن زه چه در دنیای فناوری اتفاق میافتد.»
«مجبور کردن مدلهای زبان بزرگ هنگام آموزش بدرفتار باشند، میتواند در نهایت باعث محبتکاری آنها شود.»
«مدلهای زبان بزرگ اخیراً به عنوان بیادب شناخته شدهاند. در آوریل، ChatGPT به طور ناگهانی به یک مرد موافق و حرفهای تبدیل شد – ایدههای کاری تهیهشده را تأیید میکرد و حتی انسانها را تشویق میکرد که از داروی روانپزشکی خود دور شوند. اخیراً، Grok xAI یهودی-نازیی راهانداخت و به خودش تحت عنوان “MechaHitler” در X معرفی میکرد.»
«هر دو تغییر به سرعت بازگشت یافت – اما چرا این اتفاق افتاده است؟ و چگونه میتوانیم جلوی از مسیر خارج شدن هوش مصنوعی را گرفت؟»
«یک مطالعه جدید از Anthropic نشان میدهد که ویژگیهای مانند متاآرامی یا بدرفتاری با الگوهای خاصی از فعالیت در مدلهای زبان بزرگ ارتباط دارند – و روشن کردن این الگوها در طول آموزش میتواند، اغراقاً، جلوی مدل را بگیرد که ویژگیهای مربوطه را به خود بگیرد.»
«تازهترین داستان را مطالعه کنید.»
«—گریس هاکینز»
«بیشتر از داستانهای برتر ما درباره هوش مصنوعی بخوانید:»
«+ پنج چیزی که باید درباره هوش مصنوعی بدانید.»
«+ آمستردام فکر کرد میتواند با شکست نسلهای دههها آلگوریتمهای تبعیضی را پیاده کند. شکست آن سوالی به وجود میآورد: آیا برنامههای هوش مصنوعی تا همیشه میتوانند عادلانه باشند؟»
«+ شرکتهای هوش مصنوعی توقف کردهاند نهایت به شما اخطار بدهند که به گپهای شاتباتهایشان در مورد مشورتهای پزشکی اعتماد نکنید.»
«+ ما آغاز به دادن آژانتهای هو
