ما در یک انقلاب هوش مصنوعی زندگی می کنیم. صنعت هوش مصنوعی با ابزارها، محصولات و فناوری های جدیدی که هر روز در حال ظهور است، به طور مداوم در حال پیشرفت است.
برای کسانی که با حوزه هوش مصنوعی آشنایی ندارند، هماهنگ شدن با این پیشرفت ها می تواند چالش برانگیز باشد.
بزرگترین خبر اخیر بدون شک GPT-4 است. همه از آرایشگر من گرفته تا اینفلوئنسرهای توییتر می خواهند بیشتر بدانند این فناوری چیست. همکاران توسعه دهنده نرم افزار من از این قاعده مستثنی نیستند. به نظر می رسد که ترس ماندن از قافله داریم زیرا در مورد آنچه در حوزه هوش مصنوعی می گذرد به روز نیستیم.
در این مقاله، همه چیزهایی که به طور عمومی در مورد GPT-4 می دانیم را پوشش خواهیم داد. بنابراین اگر با عباراتی مانند ChatGPT، GPT-4، OpenAI، و سایر واژه های کلیدی آشنا نیستید، این راهنمای شماست که باید بخوانید.
تاریخچه GPT تا کنون
GPT-3 OpenAI را در سال 2020 معرفی کرد. GPT-3 یک مدل زبانی است که بر روی مجموعه داده عظیمی که در اینترنت موجود است آموزش داده شده است. می تواند دوست شما باشد و به پرسش های شما پاسخ دهد، به شما در اشکال زدایی یا نوشتن کد، حل مسئلههای منطقی و استعدادیابی، ترجمه متن و موارد دیگر کمک کند.
در پایان سال 2022، این شرکت پیش نمایش رایگان ChatGPT را منتشر کرد. ChatGPT یک بات چت هوش مصنوعی است که با GPT-3.5، جانشین GPT-3 ساخته شده است. ChatGPT خیلی زود به یک گفتگوی جهانی تبدیل شد. بیش از یک میلیون نفر تنها در پنج روز برای پیش نمایش ثبت نام کردند.
در ژانویه 2023، مایکروسافت 10 میلیارد دلار در OpenAI سرمایه گذاری کرد. در ادامه در مورد اینکه چرا این مهم است بحث خواهیم کرد. و سرانجام OpenAI GPT-4 را در مارس 2023 منتشر کرد که جهان را با قابلیت های خود تکان داد.
GPT-4 چیست؟
“ترانسفورماتور 4 از پیش آموزشدیده مولد” یا GPT-4 یک مدل زبان بزرگ چندوجهی (LLM) است. قابل اعتمادتر، خلاقانه تر است و می تواند دستورالعمل های پیچیده تری را نسبت به GPT-3.5 انجام دهد. در هر پارامتر اندازه گیری از هر مدل هوش مصنوعی شناخته شده ای بهتر عمل می کند.
GPT-4 تلاش های OpenAI برای افزایش یادگیری عمیق است. این تواناترین مدل هوش مصنوعی تاکنون است. اگرچه در بسیاری از سناریوهای دنیای واقعی نسبت به انسان ها توانایی کمتری دارد، اما در چندین معیار حرفه ای و آکادمیک با دقت در سطح انسانی برتری دارد.
در دسترس بودن GPT-4
GPT-4 بر خلاف ChatGPT برای همه در دسترس نیست. چندین راه برای دسترسی به آن وجود دارد:
فهرست انتظار API: میتوانید در فهرست انتظار ثبتنام کنید و دسترسی محدود به GPT-4 API داشته باشید.
دسترسی با اولویت: توسعهدهندگان میتوانند به OpenAI Evals کمک کنند و پس از ادغام مشارکت، به API دسترسی پیدا کنند.
ChatGPT Plus: همچنین برای مشترکین ChatGPT Plus با هزینه ماهانه 20 دلار در دسترس است.
مایکروسافت بینگ: همچنین موتور جستجوی بینگ مایکروسافت را که اخیراً بازسازی شده است، تقویت می کند. در حال حاضر برای کاربران منتخب در دسترس است.
خدمات شخص ثالث: OpenAI با چندین سازمان برای ادغام GPT-4 مانند Duolingo، Morgan Stanley و Khan Academy همکاری کرده است.
توانایی های GPT-4
GPT-4 در معیارهای مختلف حرفه ای و آکادمیک از بیشتر انسان ها بهتر عمل می کند. این شرکت آخرین مدل را با نمونه قبلی با برخی از سخت ترین تست ها در جهان آزمایش کرد. و GPT-4 در هر چیزی که توسط اعداد قابل توجهی به آن داده شده بود برتر بود.
مقایسه GPT-4 با GPT-3.5 در آزمون های مختلف رقابتی (منبع: OpenAI )
OpenAI یک مقاله فنی منتشر کرد که این موضوع را بیشتر تحلیل می کند. تیم 6 ماه را صرف ساخت GPT-4 ایمن تر و هماهنگ تر کرد. GPT-4 نسبت به GPT-3.5 در ارزیابیهای داخلی ما، 82 درصد کمتر به درخواستهای محتوای غیرمجاز پاسخ میدهد و 40 درصد بیشتر احتمال دارد که پاسخهای واقعی بدهد.
روش های ورودی جدید و بهبود یافته
GPT-4 دستورات کاربر را به صورت هوشمند ارائه می کند. در مدیریت متون بزرگ و ورودی های تصویر بهتر است. همچنین می تواند شخصیت خود را تغییر دهد تا با شما صحبت کند! تا 25000 کلمه را به آن بدهید
GPT-3.5 فقط می تواند ورودی های متنی تا حداکثر 3000 کلمه را مدیریت کند. GPT-4 بسیار فراتر از این است و ورودی های تا 25000 کلمه را می پذیرد. همچنین می تواند مشارکت های گرافیکی را بپذیرد.
اگرچه GPT-4 هنگام برخورد با حجم زیادی از داده ها مشکل دارد، اما همچنان برتر از GPT-3.5 است. افزایش طول ورودی به شما کمک میکند تا درخواستهای خود را واضحتر تعریف کنید. شما می توانید تمام اسناد، پایان نامه ها، و صفحات وب را به صورت یکباره به آن بدهید.
یک تصویر را به عنوان یک درخواست بارگذاری کنید
ورودی های تصویر هنوز یک پیش نمایش تحقیقاتی هستند که هنوز به صورت عمومی در دسترس نیستند. از هماکنون، فقط چشم انسانی از جدیدترین ورودیهای تصویر پشتیبانی میکند.
با این وجود، ورودی های تصویر دارای قابلیت ها و عملکردهای یکسانی با ورودی متن هستند. کاربران می توانند چشم انداز یا زبان را برای دریافت خروجی مورد نظر خود مشخص کنند. همچنین میتوان آن را با تکنیکهای تست زمان توسعهیافته برای مدلهای زبانی که فقط دارای متن هستند، از جمله چند عکس و زنجیرهای از فکر، تقویت کرد.
یکی دیگر از مشاهدات در مورد درخواست های ورودی این است که GPT-4 مکالمات قبلی را در یک جلسه چت به یاد می آورد. این می تواند به آنچه در گذشته گفته است اشاره کند یا آنچه را که شما خواسته اید را نیز آشکار کند. اما هنوز نمی تواند مکالمات بین جلسات مختلف را به خاطر بسپارد.
می توانید شخصیت آن را تغییر دهید
باید بگویم که من طرفدار این ویژگی هستم. LLM ها می توانند شخصیت و رفتار خود را طبق درخواست کاربر تغییر دهند. ما آن را هوش مصنوعی “هدایت پذیر” می نامیم.
GPT-3.5 دارای شخصیت ثابت با واژگان، لحن و سبک از پیش تعریف شده است. هر چیزی که پاسخ دهد همان حس را دارد. با GPT-4 می توانیم شخصیت ها را در پیام سیستم توصیف کنیم. این شرکت در وبلاگ خود توضیح می دهد که برای ChatGPT راحت تر است که شخصیت خود را بشکند، بنابراین شخصیت فقط “در محدوده” تغییر می کند.
این در سناریوهایی که میخواهید پاسخ مانند یک شخصیت خاص باشد مفید است. می توانید به آن بگویید که شنونده، راهنما، سرپرست، مربی و غیره باشد.
این وبلاگ با ارائه مثالی از یک معلم سقراطی، هدایت پذیری را توضیح می دهد. روش سقراطی بحثی است بین یک فرد با خود یا دیگران که با پرسیدن مداوم سوالات و پاسخ دادن به آنها با تفکر انتقادی راه حل هایی را می یابد. با استفاده از روش سقراطی میتوانیم در مورد یک مسئله پیچیده فکر کرده و آن را بهتر درک کنیم.
پلاگین های (افزونه های) ChatGPT
زمانی که فکر کردیم همه چیز در حال آرام شدن است، OpenAI پلاگین هایی را برای ChatGPT معرفی کرد. تا کنون، GPT-4 تنها به داده های آموزشی خود متکی بود، که آخرین بار در سپتامبر 2021 به روز شد. به دنیای خارجی متصل نبود.
با افزونه ها می تواند به کل اینترنت دسترسی داشته باشد. کاربران می توانند پلاگین هایی را در ChatGPT خود نصب کنند تا به آن اجازه دسترسی به دنیای خارجی را بدهند. اکنون می تواند با دنیای واقعی و داده های به روز شده تعامل داشته باشد تا وظایف مختلفی را برای شما انجام دهد.
پلاگین ها می توانند به عنوان “چشم و گوش” برای LLM عمل کنند. این به LLM ها اجازه می دهد تا به اطلاعاتی که در داده های آموزشی خود در دسترس نیستند دسترسی داشته باشند. این شامل دادههایی است که خیلی جدید، شخصی یا خاص هستند که در دادههای آموزشی گنجانده نمیشوند. پلاگین ها می توانند از چنین اطلاعاتی برای تولید نتایج بهتر، بسیار دقیق و دقیق استفاده کنند.
همکاری 11 شرکت با OpenAI برای ساخت پلاگین (منبع: OpenAI Blog)
OpenAI برای ایجاد چنین پلاگین هایی با 11 شرکت همکاری کرده است. Expedia، FiscalNote، Milo و Zapier برخی از شرکت هایی هستند که قبلا پلاگین های خود را ساخته اند. این شرکت همچنین میزبان دو افزونه است: یک مرورگر وب و یک مفسر کد. این افزونه بازیابی پایگاه دانش منبع باز است.
شما می توانید با ارسال علاقه خود در وب سایت آن به لیست انتظار بپیوندید. اگر می خواهید بیشتر بخوانید، اخیرا وبلاگی نوشتم که در آن افزونه ها به تفصیل مورد بحث قرار می گیرد.
چه چیزی با GPT-4 ساخته شده است؟
امروزه چندین ابزار در دسترس هستند که بر روی GPT-4 ساخته شده اند. OpenAI در دو مرحله با شرکت های مختلف همکاری کرد. مرحله اول برای پرتاب خود GPT-4 بود.
مایکروسافت
منبع: Unsplash (Ed Hardie)
در ابتدای مقاله، اشاره کردم که مایکروسافت 10 میلیارد دلار در OpenAI سرمایه گذاری کرده است. مایکروسافت در حال ادغام GPT-4 در مجموعه خدمات موجود خود، معولا Office-365 و Microsoft Edge است. در اینجا توضیح مختصری از هر ابزار یا سرویس مایکروسافت ادغام شده با خدمات OpenAI/GPT-4 ارائه شده است.
Copilot برای وب: مایکروسافت بینگ و اج GPT-4 را برای تجربه بهتر، کاملتر و خلاقانهتر ادغام کردهاند.
OpenAI درAzure: ChatGPT به صورت پیش نمایش در سرویس OpenAI Azure موجود است.
Copilot X: GitHub، محصول متعلق به مایکروسافت، Copilot X را نیز معرفی کرد که از GPT-4 برای ویژگی های جدید استفاده می کند.
Copilot for Work: مایکروسافت Microsoft 365 Copilot را معرفی کرد که هدف آن تبدیل کلمات شما به قدرتمندترین ابزار بهره وری در این سیاره است.
(دولینگو) Duolingo
Duolingo Max (منبع: وبلاگ Duolingo)
دولینگو GPT-4 را ادغام کرد و دولینگو مکس را راه اندازی کرد. دو ویژگی جدید را معرفی می کند: پرسش من را پاسخ بده و نقش بازی. اولی توضیح میدهد که چرا پاسخهای کاربر درست یا غلط بوده و مثالهای بیشتری برای شفافسازی بهتر ارائه میدهد. دومی به زبان آموزان اجازه می دهد تا مهارت های مکالمه در دنیای واقعی را با شخصیت های جهان در برنامه تمرین کنند.
Be My Eyes
منبع: اینترنت
Be My Eyes بستری برای افراد کم بینا است تا به آنها کمک کند دنیا را بهتر تفسیر کنند. GPT-4 به عنوان یک داوطلب مجازی عمل می کند و تصاویر را از طریق تولید کننده تصویر به متن GPT-4 تجزیه و تحلیل می کند. این فقط محتوای تصویر را تجزیه و تحلیل نمی کند، بلکه زمینه تصویر را نیز تحلیل می کند.
آکادمی Khan
منبع: آکادمی Khan
آکادمیKhan نیز یکی از اولین پذیرندگان GPT-4 است. قصد دارد از GPT-4 به عنوان دستیار آموزشی و فنی استفاده کند. می تواند به دانش آموزان در آماده سازی امتحان، بهبود و تمرین واژگان و غیره کمک کند. همچنین می تواند به معلمان در کارهای اداری، نوشتن درس و ایجاد قلاب درس، نوشتن بلیط خروج و کارهای مشابه کمک کند.
Stripe
منبع: Stripe
اکنون Stripe در حال ادغام GPT-4 در پلتفرم خود است. این شرکت از پیش از GPT-3 برای کارهای ساده استفاده می کرد، اما ترکیب GPT-4 به این معنی است که هوش مصنوعی نقش بیشتری در فرآیندهای شرکت ایفا می کند. قصد دارد از GPT-4 برای ساده کردن تجربه کاربر و افزودن لایه دیگری از تشخیص تقلب استفاده کند.
کاری که رقبا انجام می دهند
مردم شروع به استفاده از ChatGPT و Microsoft Sydney برای جستجوهای اینترنتی خود کردند. گوگل تهدید قریب الوقوع برای کسب و کار آنها را تشخیص داد و به سرعت وارد عمل شد. این شرکت “Bard” را معرفی کرد، چت ربات هوش مصنوعی خود که با GPT-4 رقابت می کند.
منبع: Google
Google Bard یک چت ربات هوش مصنوعی مولد است که میتواند پاسخهای متنی را بر اساس درخواستها یا درخواستهای کاربر تولید کند. Bard از دانش و خلاقیت درونی خود برای ایجاد پاسخ استفاده می کند. Bard از نسخه جدید LaMDA، مدل زبانی بزرگ فوق العاده گوگل که با بازخوردهای انسانی به خوبی پیکر بندی شده است، قدرت می گیرد.
Bard اجازه می دهد تا ورودی گفتار همراه با متن ساده. همچنین به شما این امکان را می دهد که با همان اعلان جستجوی گوگل را انجام دهید تا پاسخ های Bard را تایید کنید.
نکته ای که در اینجا باید به آن توجه کرد این است که Bard مدام به ما یادآوری می کند که هنوز یک مدل آزمایشی است و ممکن است توهم داشته باشد. همچنین فراموش نکنید که گوگل از هیچ دیدگاه و نظری که Bard می گوید پشتیبانی نمی کند.
Google Bard در حال حاضر در ایالات متحده و بریتانیا در دسترس است. شما می توانید با مراجعه به وب سایت رسمی Bard به لیست انتظار بپیوندید. من یک وبلاگ نوشتم که در مورد Bard بیشتر بحث می کرد. حتما شما هم بخوانید.
آیا هوش مصنوعی شغل شما را خواهد گرفت؟
پس از خواندن کل مقاله، ممکن است در مورد شغل خود احساس نگرانی کنید. OpenAI، OpenReseach و دانشگاه پنسیلوانیا مقاله ای با عنوان “GPT ها GPT هستند: نگاهی اولیه به پتانسیل تاثیر بازار کار مدل زبان بزرگ” منتشر کردند تا تاثیر بالقوه چنین ابزارهایی را بر بازار کار تحلیل کنند.
بر اساس این مطالعه، 10 درصد از وظایف در 80 درصد از کارگران ایالات متحده می تواند توسط LLM انجام شود. برای %19 دیگر از کارگران، LLM می تواند حداقل %50 از وظایف را تحت تاثیر قرار دهد. مشاغل با درآمد بالاتر به طور بالقوه با قرار گرفتن در معرض بیشتر مواجه خواهند شد. مشاغل برنامه نویسی و نویسندگی نیز تحت تاثیر قرار خواهند گرفت. از طرفی مشاغلی که نیاز به تفکر انتقادی و علم دارند بی خطر هستند. به طور مشابه، مشاغل با مانع ورود کم کمتر تحت تاثیر قرار می گیرند.
این مشاغل به احتمال زیاد توسط هوش مصنوعی تصاحب می شوند:
- ریاضیدانان
- تهیه کنندگان مالیات
- نویسندگان
- طراحان وب، برنامه نویسان
- حسابداران
- روزنامه نگاران
- منشی های حقوقی
هوش مصنوعی احتمال بیشتری دارد که این مشاغل را بپذیرد (منبع: مقاله پژوهشی)
مشاغلی که کمتر تحت تاثیر GPT قرار می گیرند به شرح زیر هستند:
- طراحان گرافیک
- استراتژی های بازاریابی جستجو
- مدیران مالی
محققان همچنین تاثیر LLM بر صنایع مختلف را فهرست می کنند. صنایعی که بیشترین تاثیر را دارند به شرح زیر است:
- خدمات پردازش داده ها
- خدمات اطلاعاتی
- صنایع انتشاراتی
- حامل های بیمه
از سوی دیگر، صنایعی که بیشترین تاثیر را دارند عبارتند از:
- تولید مواد غذایی
- تولید محصولات چوبی
- پشتیبانی از تولید
- جنگلداری کشاورزی
بعید است که هوش مصنوعی این مشاغل را بپذیرد (منبع: مقاله تحقیقاتی)
پایان
اگر تا آخر این مطلب را خواندید، برای خودتان دست بزنید! شما راه درازی را پیموده اید و باید به اندازه کافی در مورد این فناوری جدید بدانید که بتوانید دانش خود را در جلسات و جمع بندی ها به اشتراک بگذارید.
امیدوارم در این مرور کلی از ChatGPT چیزی یاد گرفته باشید. اگر این کار را کردید، آن را در شبکه های اجتماعی خود به اشتراک بگذارید تا همه بتوانند از آن بهره مند شوند.