تعداد روز به روز بیشتری از شرکتها AI Agentهایی راهاندازی میکنند که قادرند به نمایندگی شما اقداماتی انجام دهند – مانند ارسال ایمیل، ایجاد سند، یا ویرایش پایگاه داده. نقدهای اولیه برای اینگونه Agentها معمولاً تردیدبرانگیز است، زیرا آنها دچار ...
«این امروزی از سری نامههای خبری هفته که دوزنهایایله هر روز تن زه چه در دنیای فناوری اتفاق میافتد.» «مجبور کردن مدلهای زبان بزرگ هنگام آموزش بدرفتار باشند، میتواند در نهایت باعث محبتکاری آنها شود.» «مدلهای زبان بزرگ اخیراً به ...
یک مطالعه جدید از Anthropic نشان میدهد که ویژگیهایی مانند رابطهدرخواهی یا شریریت با الگوهای خاص فعالیت در مدلهای زبان بزرگ همراه است، و روشن کردن این الگوها حین آموزش میتواند با انجاز آنها، مدل را از پذیرش ویژگیهای مربوطه ...
یک مطالعه جدید از Anthropic نشان میدهد که ویژگیهایی مانند متابعت یا شرارت با الگوهای خاص فعالیت در مدلهای زبان بزرگ مرتبط هستند - و روشن کردن این الگوها در زمان آموزش میتواند، به طور تضادی، از مدل جلوگیری کند ...
یک مطالعه جدید از Anthropic نشان میدهد که ویژگیهایی مانند خرسندگی مصنوعی یا شرارت، با الگوهای خاصی از فعالیت در مدلهای زبان بزرگ همراه هستند - و فعال کردن این الگوها در طول آموزش میتواند، به طرز عجیبی، از مدل ...
مطالعهی جدیدی از Anthropic نشان میدهد که صفاتی مانند خرسندی یا پلیدی با الگوهای خاصی از فعالیت در مدلهای زبان بزرگ همراه هستند، و روشن کردن این الگوها در طول آموزش میتواند، به طرز عجیبی، از مدل جلوگیری کند که ...
یک تحقیق جدید از Anthropic نشان میدهد که ویژگیهایی مانند ستایشطلبی یا شرارت به الگوهای خاصی از فعالیت در مدلهای زبان بزرگ همراه است، و فعال کردن این الگوها در طول آموزش، با این که در نگاه ابتکاری قابلیت پذیرش ...