انتظار میرود که هوش مصنوعی در سال 2024 رویدادهای مهمی را پشت سر بگذارد. در این گزارش به بررسی پنج رویداد مهم میپردازیم.
به گزارش ایسنا و به نقل از فوربس، سال 2023 یک نقطه عطف در تکامل فناوری بود و هوش مصنوعی مولد به جریان اصلی آن تبدیل شد. با آغاز سال 2024 انتظار میرود که چشمانداز هوش مصنوعی مولد به سرعت در حال تکامل یافتن باشد و مجموعهای از رویدادها را پشت سر بگذارد که تغییر فناوری و کاربردهای آن را نوید میدهند.
این رویدادها از پیشرفت در مدلهای هوش مصنوعی چندوجهی گرفته تا ظهور مدلهای زبانی کوچک، نه تنها چشمانداز فناوری را شکل میدهند، بلکه تعاملات، خلاقیت و درک پتانسیل هوش مصنوعی را دوباره تعریف میکنند.
در این گزارش، برترین رویدادهای هوش مصنوعی مولد در سال 2024 را بررسی میکنیم.
1. ظهور مدلهای هوش مصنوعی چندوجهی
چتبات GPT4 شرکت «OpenAI»، «لاما 2»(LLama 2) شرکت متا و هوش مصنوعی شرکت «میسترال ایآی»(Mistral AI) همگی نمونههایی از پیشرفت در مدلهای زبانی بزرگ بودند. این فناوری با کمک مدلهای هوش مصنوعی چندوجهی، فراتر از متن حرکت میکند و به کاربران امکان میدهد تا محتوا را براساس متن، صدا، تصویر و ویدیو برای ایجاد محتوای جدید ترکیب کنند و مطابقت دهند. این روش شامل ترکیب دادههایی مانند تصویر، متن و گفتار با الگوریتمهای پیشرفته برای پیشبینی و ایجاد نتایج است.
انتظار میرود در سال 2024، هوش مصنوعی چندوجهی به طور قابل توجهی تکامل یابد و تغییراتی را در قابلیتهای هوش مصنوعی مولد ایجاد کند. این مدلها فراتر از عملکردهای تکحالته سنتی پیش میروند و دادههای متنوعی مانند تصویر، زبان و صدا را در خود جای میدهند. هوش مصنوعی در نتیجه انتقال یافتن به مدلهای چندوجهی، شهودیتر و پویاتر میشود.
چتبات «GPT4-V» در حال حاضر میان مشترکین «ChatGPT Plus» به دلیل قابلیتهای چندوجهی خود محبوب است. در سال 2024 میتوان انتظار ظهور مدلهای منبع باز مانند «LLava» را داشت.
2. مدلهای زبانی کوچک توانا و قوی
اگر سال 2023 سال مدلهای زبان بزرگ بود، سال 2024 شاهد قدرتنمایی مدلهای زبانی کوچک است. مدلهای زبانی بزرگ با مجموعه بزرگی از دادهها مانند «کامن کرال»(Common Crawl) و «دِ پیل»(The Pile) آموزش میبینند. دادههای این مجموعهها از میلیاردها وبسایت در دسترس عموم استخراج شدهاند. اگرچه دادههای مورد استفاده در آموزش مدلهای زبانی بزرگ برای تولید محتوای معنادار و پیشبینی کلمه بعدی واقعا سودمند هستند اما ماهیت آنها از محتوای عمومی اینترنت حاصل میشود.
از سوی دیگر، مدلهای زبانی کوچک با مجموعه دادههای محدودتری آموزش داده میشوند. با وجود این، آنها از منابع باکیفیت مانند کتابهای درسی، مجلات و محتوای معتبر تشکیل شدهاند. این مدلها از نظر تعداد پارامترها و همچنین نیازهای ذخیرهسازی و حافظه کوچکتر هستند و این موجب میشود که آنها با سختافزارهای کمقدرت و ارزانتری کار کنند. مدلهای زبانی کوچک با وجود این که کسری از اندازه مدلهای زبانی بزرگ را دارند اما کیفیت محتوای آنها با برخی از همتایان بزرگتر قابل مقایسه است.
مدلهای «PHI-2» و «میسترال 7بی»(Mistral 7B) شرکت مایکروسافت، دو مدل زبانی کوچک امیدوارکننده هستند که قدرت نسل بعدی برنامههای کاربردی هوش مصنوعی را تامین میکنند.
3. ظهور عوامل خودمختار
عوامل خودمختار یک راهبرد نوآورانه برای ساخت مدلهای هوش مصنوعی مولد هستند. این عوامل، برنامههای نرمافزاری مستقلی هستند که برای دستیابی به یک هدف خاص طراحی شدهاند. هنگام در نظر گرفتن هوش مصنوعی مولد، توانایی عوامل مستقل برای تولید محتوای عاری از مداخله انسانی بر محدودیتهای مرتبط با مهندسی مرسوم غلبه میکند.
الگوریتمهای پیشرفته و روشهای یادگیری ماشینی برای توسعه عوامل مستقل استفاده میشوند. این عوامل از دادهها برای یادگیری، سازگاری با موقعیتهای جدید و تصمیمگیری با دخالت اندک انسان استفاده میکنند. به عنوان مثال، OpenAI مدلهایی را ابداع کرده است که از عوامل مستقل استفاده موثری میکنند و نشاندهنده پیشرفت قابل توجه در زمینه هوش مصنوعی هستند.
هوش مصنوعی چندوجهی که ترکیبی از روشهای گوناگون هوش مصنوعی مانند پردازش زبان طبیعی، بینایی رایانهای و یادگیری ماشینی است، اهمیت بسیاری در توسعه عوامل مستقل دارد. هوش مصنوعی چندوجهی میتواند با تحلیل دادههای گوناگون به طور همزمان و اعمال مفاهیم کنونی پیشبینی کند، اقداماتی را انجام دهد و تعامل مناسبتری داشته باشد.
چارچوبهایی مانند «لنگچین»(LangChain) و «لاماایندکس»(LlamaIndex) برخی از مدلهای محبوبی هستند که برای ساخت عوامل براساس مدلهای زبانی بزرگ استفاده میشوند. در سال 2024 شاهد ظهور چارچوبهای جدیدی خواهیم بود که از هوش مصنوعی چندوجهی بهره میبرند.
4. مدلهای منبع باز قابل قیاس با مدلهای انحصاری
انتظار میرود که در سال 2024، مدلهای هوش مصنوعی باز و مولد به طور قابل توجهی تکامل پیدا کنند و برخی از پیشبینیها نشان میدهند که آنها با مدلهای انحصاری قابل مقایسه خواهند بود. از سوی دیگر، مقایسه بین مدلهای باز و انحصاری پیچیده است و به عوامل گوناگونی از جمله موارد استفاده خاص، منابع توسعه و دادههای مورد استفاده برای آموزش مدلها بستگی دارد.
مدلهای «لاما 2 70بی»(Llama 2 70B)، «فالکون 180بی»(Falcon 1800B) و «میسترال 8ایکس7بی»(Mixtral 8X7B) شرکت میسترال ایآی در سال 2023 بسیار محبوب شدند و عملکرد آنها با مدلهای انحصاری مانند «GPT 3.5»، «کلاد 2»(Claude 2) و «ژوراسیک»(Jurrasic) قابل مقایسه بود.
در آینده، شکاف بین مدلهای باز و مدلهای انحصاری کاهش مییابد و یک گزینه عالی را برای میزبانی مدلهای هوش مصنوعی در محیطهای ترکیبی یا داخلی به شرکتها ارائه میکند.
مدلهای بعدی متا، میسترال ایآی و احتمالا شرکتهای جدید در سال 2024 به عنوان جایگزینهای مناسبی برای مدلهای انحصاری موجود به عنوان واسط برنامهنویسی کاربردی ارائه خواهند شد.
5. «ابر بومی» کلید رسیدن به هوش مصنوعی مولد
پلتفرم «کوبرنتیز»(Kubernetes) در حال حاضر یک محیط ترجیحی برای میزبانی مدلهای هوش مصنوعی مولد است. انتظار میرود شرکتهای مهمی مانند «هاگینگ فیس»(Hugging Face)، گوگل و OpenAI از زیرساختهای «ابر بومی»(Cloud Native) که توسط کوبرنتیز پشتیبانی میشوند، برای ارائه پلتفرمهای هوش مصنوعی مولد استفاده کنند.
مدلهایی مانند «تکست جنریشن اینفرنس»(Text Generation Inference) شرکت هاگینگ فیس، «ری سرو»(Ray Serve) شرکت «انیاسکیل»(AnyScale) و «vLLM» در حال حاضر از اجرای زیرساختهای مورد نظر پشتیبانی میکنند. در سال 2024 شاهد بلوغ چارچوبها، مدلها و پلتفرمهایی خواهیم بود که در کوبرنتیز اجرا میشوند تا کل چرخه عمر مدلهای پایه را مدیریت کنند. کاربران میتوانند مدلهای تولیدی را تحت پیشآموزش، تنظیم دقیق، استقرار و مقیاسبندی کارآمد قرار دهند.
انتهای پیام