اینترنت بیش ازحد کوچک است و برای هوش مصنوعی کافی نیست!
به گزارش وبلاگ سایه، به نظر می رسد که داده های موجود در اینترنت برای توسعه مدل های هوش مصنوعی کافی نیستند.
به گزارش خبرگزاری وبلاگ سایه و براساس گزارش زومیت، شرکت های هوش مصنوعی هرچقدر که به ساخت مدل های بزرگ تر و بهتر ادامه می دهند، بیشتر با مسئله ای خاص روبرو می شوند: اینترنت به مقدار کافی بزرگ نیست تا همه داده های لازم را فراهم کند. داده ها نقش محوری در توسعه هوش مصنوعی ایفا می نمایند. هرچه داده های بیشتری برای آموزش مدل هوش مصنوعی استفاده گردد، آن سیستم هوشمندتر می گردد. درمقابل، به نظر می رسد که داده های طبیعی (فراوریشده انسان) منابع محدودی هستند و ممکن است روزی تمام شوند.
مؤسسه آینده پژوهی Epoch AI پیش بینی نموده است که شرکت های هوش مصنوعی احتمالاً تا سال 2026 با کمبود داده های آموزشی متنی باکیفیت روبرو خواهند شد. به گزارش روزنامه وال استریت ژورنال، ازآنجاکه رشد محتواهای موجود در اینترنت سریع نیست، برخی از شرکت ها در حال جست وجوی منابع جایگزین برای آموزش مدل ها هستند و به گزینه هایی مانند زیرنویس ویدئوها یا حتی اطلاعات ساخته شده با هوش مصنوعی مولد فکر می نمایند.
گفته می گردد که OpenAI مدل GPT-5 را به یاری زیرنویس ویدئوهای عمومی یوتیوب توسعه داده است. مدتی پیش میرا موراتی، مدیر ارشد فناوری OpenAI، از پاسخ به این پرسش که آیا از محتواهای یوتیوب برای آموزش مدل هوش مصنوعی سورا (Sora) استفاده شده است؟، خودداری کرد. به کارگیری داده های ساختگی برای تعلیم مدل های هوش مصنوعی موضوع بحث فراوانی در ماه های اخیر بوده است و برخی از پژوهشگران دریافته اند که آموزش مدل هوش مصنوعی مبتنی بر داده هایی که قبلاً هوش مصنوعی دیگر فراوری نموده اند، می تواند به فروپاشی مدل یا خلق نتایج معیوب منجر گردد.
برخی از شرکت ها مانند OpenAI و Anthropic، خالق مدل هوش مصنوعی Claude، در پی فراوری محتواهای ساختگی باکیفیت تری هستند تا از شکل گیری مدلی جلوگیری نمایند که با داده های بی ارزش آموزش دیده باشد. بااین حال، هیچ کدام از آن ها جزئیات دقیق پروژه هایشان را فاش ننموده اند. آنتروپیک هنگام رونمایی Claude 3 گفت که این مدل براساس داده هایی که خودشان فراوری نموده اند، آموزش دیده است. جرد کاپلان، دانشمند ارشد آنتروپیک، نیز در مصاحبه با وال استریت ژورنال خاطرنشان کرد که معتقد است برای داده های ساختگی نیز کاربردهای زیادی وجود دارد.
مجله هاروارد بیزینس ریویو می نویسد: در پنج سال آینده، اپلیکیشن ها و دستگاه ها کمتر مصنوعی و بیشتر هوشمند خواهند شد. آن ها کمتر به یادگیری از کلان داده ها و بیشتر به استدلال از کل به جزء وابسته خواهند بود که شبیه روش انسان ها در حل مسائل و انجام وظایف است. قدرت استدلال می تواند کاربردهای گسترده تری برای هوش مصنوعی فراهم کند.
227323
منبع: خبرآنلاین