تعداد روز به روز بیشتری از شرکتها AI Agentهایی راهاندازی میکنند که قادرند به نمایندگی شما اقداماتی انجام دهند – مانند ارسال ایمیل، ایجاد سند، یا ویرایش پایگاه داده. نقدهای اولیه برای اینگونه Agentها معمولاً تردیدبرانگیز است، زیرا آنها دچار ...
«این امروزی از سری نامههای خبری هفته که دوزنهایایله هر روز تن زه چه در دنیای فناوری اتفاق میافتد.» «مجبور کردن مدلهای زبان بزرگ هنگام آموزش بدرفتار باشند، میتواند در نهایت باعث محبتکاری آنها شود.» «مدلهای زبان بزرگ اخیراً به ...
یک مطالعه جدید از Anthropic نشان میدهد که ویژگیهایی مانند رابطهپذیری یا شرارت با الگوهای خاصی از فعالیت در مدلهای زبان بزرگ همراه هستند و فعالسازی این الگوها به موقع در طول آموزش میتواند در عجیبترین حالت، از مدل جلوههای ...
یک تحقیق جدید از Anthropic نشان میدهد که ویژگیهایی مانند ستایشطلبی یا شرارت به الگوهای خاصی از فعالیت در مدلهای زبان بزرگ همراه است، و فعال کردن این الگوها در طول آموزش، با این که در نگاه ابتکاری قابلیت پذیرش ...
مطالعهی جدیدی از Anthropic نشان میدهد که صفاتی مانند خرسندی یا پلیدی با الگوهای خاصی از فعالیت در مدلهای زبان بزرگ همراه هستند، و روشن کردن این الگوها در طول آموزش میتواند، به طرز عجیبی، از مدل جلوگیری کند که ...
یک مطالعه جدید از Anthropic نشان میدهد که ویژگیهایی مانند خرسندگی مصنوعی یا شرارت، با الگوهای خاصی از فعالیت در مدلهای زبان بزرگ همراه هستند - و فعال کردن این الگوها در طول آموزش میتواند، به طرز عجیبی، از مدل ...
یک مطالعه جدید از Anthropic نشان میدهد که ویژگیهایی مانند متابعت یا شرارت با الگوهای خاص فعالیت در مدلهای زبان بزرگ مرتبط هستند - و روشن کردن این الگوها در زمان آموزش میتواند، به طور تضادی، از مدل جلوگیری کند ...