مدل استدلال سلسلهمراتبی (HRM) فراتر از LLMها منتشر شد!
انتشار متنباز مدل استدلال سلسلهمراتبی Sapient Intelligence؛ معماری الهامگرفته از مغز انسان برای حل مسائل پیچیده با تنها ۲۷ میلیون پارامتر
شرکت تحقیقاتی AGI به نام Sapient Intelligence امروز از انتشار متنباز مدل استدلال سلسلهمراتبی Hierarchical reasoning model (HRM) خبر داد؛ معماریای الهامگرفته از مغز انسان که با بهرهگیری از ساختار سلسلهمراتبی و پردازش در چند بازه زمانی، به عمق محاسباتی قابلتوجهی دست یافته، بدون آنکه پایداری یا بهرهوری آموزشی را قربانی کند. این مدل تنها با ۱۰۰۰ نمونه آموزشی و بدون هیچگونه پیشآموزش، و با ۲۷ میلیون پارامتر، موفق شده چالشهای استدلالی را حل کند که هنوز برای مدلهای زبانی بزرگ (LLM) دشوار باقی ماندهاند.
فراتر از محدودیتهای مدلهای زبانی بزرگ
مدلهای زبانی فعلی به شدت به روش Chain-of-Thought (زنجیره تفکر) وابستهاند؛ روشی که اغلب با تجزیه وظایف شکننده، نیاز به دادههای آموزشی عظیم و تأخیر بالا مواجه است. HRM با الهام از پردازش سلسلهمراتبی و چندزمانی در مغز انسان، این محدودیتها را با سه اصل بنیادی در محاسبات قشری مغز پشت سر میگذارد: پردازش سلسلهمراتبی، جداسازی زمانی، و اتصال بازگشتی. این مدل از دو ماژول تشکیل شده:
- یکی برای برنامهریزی انتزاعی آهسته در سطح بالا،
- و دیگری برای محاسبات سریع و دقیق در سطح پایین.
HRM قادر است در یک عبور پیشرو، بهطور پویا بین تفکر خودکار (“سیستم ۱”) و استدلال آگاهانه (“سیستم ۲”) جابجا شود.
Guan Wang، بنیانگذار و مدیرعامل Sapient Intelligence میگوید:
«هدف AGI، دستیابی به هوش در سطح انسان و فراتر از آن است. روش CoT فقط تلاش میکند با شبیهسازی تفکر انسانی، شانس موفقیت را بالا ببرد؛ اما این فقط یک راهحل موقت است. ما در Sapient از صفر شروع کردهایم، با معماریای الهامگرفته از مغز، چون طبیعت میلیاردها سال صرف بهینهسازی آن کرده. مدل ما واقعاً مثل انسان فکر میکند و استدلال دارد، نه فقط محاسبه احتمال برای عبور از آزمونها. باور داریم این مدل به سطح هوش انسانی میرسد و آن را پشت سر میگذارد؛ و آنجاست که بحث واقعی هوش مصنوعی عمومی (AGI) آغاز میشود.»
دستاوردهای چشمگیر HRM در آزمونها
با وجود مقیاس کوچک ۲۷ میلیون پارامتر و تنها ۱۰۰۰ نمونه ورودی-خروجی، بدون هیچگونه پیشآموزش یا نظارت CoT، HRM توانسته مسائلی را حل کند که حتی پیشرفتهترین مدلهای LLM در آنها ناکام ماندهاند. در چالش ARC-AGI-2، که یکی از معتبرترین معیارهای استدلال القایی است، HRM به امتیاز ۵٪ دست یافته؛ عددی که بهطور قابلتوجهی از مدلهایی چون OpenAI o3-mini-high، DeepSeekR1 و Claude 3.7 8K با اندازهها و طول زمینه بسیار بیشتر، بالاتر است. در حل سودوکوهای پیچیده و یافتن مسیر بهینه در هزارتوهای ۳۰×۳۰، جایی که روشهای CoT کاملاً شکست میخورند، HRM دقتی نزدیک به کامل ارائه میدهد.
تیم Sapient Intelligence در حال اجرای آزمایشهای جدید است و انتظار دارد بهزودی نتایج قویتری در ARC-AGI منتشر کند.
تأثیرات واقعی HRM در جهان
کارایی دادهای و دقت استدلال HRM فرصتهای جدیدی را در حوزههایی فراهم میکند که دادههای بزرگ در دسترس نیستند اما دقت بالا حیاتی است. در حوزه سلامت، Sapient با مؤسسات برجسته تحقیقاتی پزشکی همکاری میکند تا HRM را در تشخیصهای پیچیده، بهویژه بیماریهای نادر با سیگنالهای ضعیف و نیازمند استدلال عمیق، بهکار گیرد. در پیشبینی اقلیم، HRM دقت پیشبینیهای فصلی تا میانفصلی (S2S) را به ۹۷٪ افزایش داده؛ جهشی که مستقیماً به ارزش اجتماعی و اقتصادی تبدیل میشود. در رباتیک، معماری سبک و کمتأخیر HRM بهعنوان «مغز تصمیمگیرنده» روی دستگاه عمل میکند و به رباتهای نسل جدید امکان درک و واکنش در زمان واقعی در محیطهای پویا را میدهد.