آخرین خبرها

پربازدیدهای ماه

داغ روز

روزنامه دولت: هفته پیش، رئیسی در باره برخوردهای نامناسب با پدیده بی حجابی تذکر داده بود

چین تنها خریدار همه نفت خام ایران؟ / فروش نفت به بالاترین میزان از سال2019 رسید

در سیستم حاکمیتی کشور، وزیر اقتصاد ، هیچکاره است/ سیاست پولی و مالی دولت در جای دیگری تنظیم می‌شود!

زمان دقیق افزایش حقوق بازنشستگان ۱۴۰۳ اعلام شد/ مدیرعامل تامین‌اجتماعی درباره حقوق مستمری‌بگیران چه گفت؟

بودجه ۱۴۰۳ چه زمانی نهایی می‌شود؟

کد خبر: 101775

علم و فن آوری

یکشنبه, ۰۳ شهریور ۱۳۹۸ ۱۸:۱۰

۱۰

یادگیری ماشین چقدر به انسان نیاز دارد؟

امروزه، به‌لطف پیشرفت‌های هوش مصنوعی، به‌ویژه یادگیری ماشین، نسل جدیدی از فناوری‌ها ظهور کرده‌اند که فرصت‌های جدیدی برای برتری عملیاتی در بخش‌های صنعتی به‌وجود آورده‌اند.

با وجود گذشت ده‌ها سال از ظهور اولین نرم‌افزارهای پیشرفته‌ی صنعتی، یادگیری ماشین هنوزهم برای عملکرد بهینه و بدون خطا نیازمند مداخله‌ی انسانی است.

پس از گذشت چهار دهه از زمان کاربرد اولین نرم‌افزار پیشرفته در صنایع دارایی‌بر مانند تأسیسات، فرودگاه‌ها، بندرگاه‌‌ها، جاده‌ها، خط‌آهن و معدن، تولیدکنندگان مسیری درخورتوجه به‌منظور تحول کسب‌وکار خود و تولید ارزش‌افزوده برای ذی‌نفعان طی کرده‌اند. صنایع دارایی‌بر صنایعی هستند که وابستگی زیادی به دارایی‌های فیزیکی خود دارند.

امروزه، به‌لطف پیشرفت‌های هوش مصنوعی، به‌ویژه یادگیری ماشین، نسل جدیدی از فناوری‌ها ظهور کرده‌اند که فرصت‌های جدیدی برای برتری عملیاتی در بخش‌های صنعتی به‌وجود آورده‌اند. کسب‌وکارها برای سبقت از یکدیگر، نه‌تنها باید پیچیدگی‌های یادگیری ماشین را درک کنند؛ بلکه باید براساس آن عمل کنند و بدین‌ترتیب به مزیت برسند.

ناگفته نماند آخرین راه‌حل‌های یادگیری ماشین می‌توانند چند هفته زودتر به وجود خرابی یا نقص در دارایی‌ها پی ببرند و با تشخیص الگوهای داده‌ای پیچیده و کشف آثار دقیق خرابی یا نقص، تجهیزات ناهنجار را از تجهیزات عادی تفکیک کنند.

مایک بروکز، مدیر ارشد شرکت نرم‌افزاری بهینه‌سازی اسپن‌تِک (AspenTech)، در این باره می‌گوید:

سیستم‌های یادگیری ماشین می‌توانند به اپراتورها هشدار دهند و برای دوری از خطاهای احتمالی یا کاهش پیامدها، راه‌حل‌هایی تعریف کنند. روش یادگیری ماشین بدون ناظر، روشی مختص الگوهای یادگیری عملکرد یا رفتار است که از تکنیک‌های دسته‌بندی استفاده می‌کند.

علاوه‌براین، در این قبیل‌ سیستم‌ها می‌توان براساس سیگنال‌های دریافتی از حسگرها و ماشین‌ها رفتارهای عملیاتی را درک کرد و پس از یادگیری الگوهای رفتاری و تحلیل داده‌های جدید، به انحراف‌ها یا ناهنجاری‌ها پی برد. درنهایت، با پی‌بردن به ناهنجاری‌ها می‌توان مشکلات مکانیکی و تغییرات فرایند تأثیرگذار بر بخش‌های مختلف تجهیزات را شناسایی کرد. بااین‌حال، ممکن است روش یادگیری بدون ناظر پر از خطا باشد و همیشه به مداخله‌ی انسان نیاز داشته باشد. بروکز معتقد است:

این روش در کشف هم‌بستگی‌ها عملکرد خوبی دارد؛ اما کارایی‌اش در علت‌یابی مشکل کمتر است. یادگیری ماشین بدون دخالت انسان صرفا می‌تواند هم‌بستگی‌های بی‌معنی، ولی واقعی مثل رابطه‌ی کاهش مرگ در بزرگ‌راه‌های ایالات‌ متحده و واردات لیمو از مکزیک را پیدا کند.

وقتی یادگیری ماشین بدون ناظر موفق می‌شود ناهنجاری را کشف کند، تغییر در الگوی رفتاری دو حالت دارد: وضعیت عملیاتی جدید یا بروز خطای احتمالی. اینجا است که عاملی انسانی باید ماشین را بررسی و برای انتخاب گزینه‌ی صحیح تصمیم‌گیری کند. مداخله‌ی دستی به قابلیت تطبیق و یادگیری سیستم کمک می‌کند و تحلیلی مطمئن برای کسب‌وکار ارائه می‌کند.

افزون‌براین، هم‌بستگی (Correlation) با علت‌یابی (Causation) یکسان نیست؛ بنابراین، یادگیری ماشین برای یادگیری صحیح به راهنمای انسانی نیاز دارد. برای مثال، فناوری‌های تشخیص صدا از یادگیری ماشین استفاده می‌کنند؛ اما بدون کمک نمی‌توانند یاد بگیرند. دستیارهای شخصی هم برای تفسیر عبارت‌های پردازش‌نشده و ترجمه‌ی آن‌ها به ناظران انسانی نیاز دارند.

به‌طور مشابه، قابلیت کشف فریب کارت اعتباری باید رفتار خرید را یاد بگیرد. ممکن است شرکت کارت اعتباری بپرسد: «آیا می‌خواهید بلیت هواپیما را در پاریس بخرید؟» در این صورت صادرکننده‌ی کارت اعتباری از یادگیری ماشین برای درک الگوهای عادی خرید استفاده می‌کند و بدین‌ترتیب رفتار ناهنجار را تشخیص می‌دهد. بروکز می‌گوید:

ورودی ساده‌ی بله یا خیر، برای تشخیص ناهنجاری کافی است و رفتارهای خرید عادی را از رفتارهای فریب‌دهنده تفکیک می‌کند.

به همین ترتیب، یادگیری ماشین بدون ناظر برای عملکرد مؤثر نیازمند مداخله‌ی انسان است و باید رویداد و زمان و تاریخ آن را برای آن تعریف کرد. علاوه‌بر‌این، فناوری باید نشان الگوهای دقیقی را شناسایی کند که به اتفاق منجر می‌شوند. برای مثال، این الگوها در صنایع دارایی‌بر می‌توانند به نقص در دستگاه‌ها منجر شوند. بروکز درباره‌ی این موضوع می‌گوید:

فناوری در درجه‌ی اول به یادگیری و ارزیابی الگوی خطا می‌پردازد. سپس، برای یافتن احتمال دقیق بازگشت الگو، جریان‌های داده‌ای ورودی را آزمایش می‌کند. در مرحله‌ی بعد، قبل از وقوع خطا هشدار می‌دهد و زمان لازم را برای رفع خطا یا تعمیر قبل از وقوع خسارت بزرگ فراهم می‌کند. بدین‌ترتیب، هزینه‌ی نگه‌داری کاهش می‌یابد و محصولات ارزشمندتری تولید می‌شوند.

چشم‌اندازهای درخشان

موریس با تأکید بر مزایای یادگیری ماشین در راه‌اندازی بهینه‌ی تأسیسات و بهینه‌سازی عملکرد موجودی‌ها، صاحبان کسب‌وکارهای دارایی‌بر را به استفاده از این فناوری تشویق می‌کند. در بازارهای شلوغ امروزی، فرصت استفاده از یادگیری ماشین و مزایای آن برای پیش‌بینی عملکرد دارایی و افزایش مزایای کسب‌وکار و توسعه‌ی مرز رقابتی به‌وجود آمده است. موریس معتقد است:

یادگیری ماشین از نوع بدون نظارت، می‌تواند به کسب‌وکارها در شناسایی ناهنجاری‌ها و عملکرد کمک کند؛ اما سازمان‌ها باید آگاه باشند که یادگیری ماشین برای عملکرد در سطوح بهینه نیازمند هوش و راهنمایی انسانی است. یادگیری ماشین هنوز برای یافتن و حل مشکلات به راهنما نیاز دارد.

کسب‌وکارهای دارایی‌بر که به درک صحیحی از مزایای یادگیری ماشین می‌رسند، به بهترین شکل می‌توانند از مزایای آن برخوردار شوند و با ارزیابی الگوهای رفتاری دارایی و رسیدن به دیدگاه صحیح و توسعه‌ی خودکار چشم‌انداز، عملکرد دارایی در کل عملیات خود را می‌توانند بهینه‌سازی کنند.

استفاده از یادگیری ماشین برای ترجمه‌ زبان‌های فراموش شده

گروهی از محققان موفق شدند با استفاده از ترجمه‌ی ماشینی، یکی از زبان‌های فراموش‌شده‌‌ی دنیا را به‌صورت خودکار رمزگشایی کنند.

در سال ۱۸۸۶، باستان‌شناسی بریتانیایی به‌نام آرتور اِونز، به سنگی باستانی برخورد که حامل حکاکی‌هایی جالب به زبانی ناشناخته بود. این سنگ متعلق به جزیره‌ی مدیترانه‌ای کرت (Crete) بود و اونز برای یافتن شواهد بیشتر، بلافاصله به آنجا سفر کرد. طولی نکشید که او تعداد زیادی سنگ و لوح که همگی حکاکی‌های مشابهی داشتند، پیدا کرد و آن‌ها را متعلق به ۱۴۰۰ سال پیش از میلاد مسیح دانست.

این سنگ‌نوشته‌ها حامل یکی از قدیمی‌ترین خط‌های کشف‌شده بودند. اونز عقیده داشت که فرم خطی این زبان، ریشه در تصاویر خطی دوران اولیه‌ی هنر دارد؛ درنتیجه از اهمیت بسیار زیادی در تاریخ زبان‌شناسی برخوردار است.

او و چند دانشمند دیگر متوجه‌شدند که این سنگ‌ها و لوح‌ها به دو زبان متفاوت نوشته شده‌ بودند. زبان قدیمی‌تر که به آن «خطی الف (Linear A)» می‌گویند، مربوط به سال‌های ۱۴۰۰ تا ۱۸۰۰ پیش از میلاد است؛ زمانی‌ که جزیره تحت‌ سلطه‌ی تمدن مینوسی در دوران برنز بود.

زبان دیگر که «خطی ب (Linear B)» نام دارد، جدیدتر بوده و در سال‌های پس از ۱۴۰۰ پیش از میلاد و در دوران سلطه‌ی میکایی‌های یونان، پدید آمده‌ است.

اونز و همکارانش تلاش بسیاری کردند تا این زبان‌های باستانی را رمزگشایی کنند ولی هیچ‌یک از تلاش‌های آنان به نتیجه نرسید. این مشکل حل‌نشده باقی ماند تا اینکه در سال ۱۹۵۳، یک زبان‌شناس تازه‌کار به‌نام مایکل وِنتریس موفق شد زبان خطی ب را رمزگشایی کند.

راهکار او مبتنی بر دو پیشرفت تعیین‌کننده بود. اول اینکه ونتریس حدس زد بخش زیادی از کلمات تکرارشده در زبان خطی ب، نام مکان‌هایی در جزیره‌ی کرت بود. حدس او درست بود.

پیشرفت دوم او این بود که فرض کرد این زبان، فرمی ابتدایی از زبان یونانی باستان بود. این دید باعث شد که او بتواند به‌سرعت سایر زبان را هم رمزگشایی کند. طی این فرایند، ونتریس نشان داد که یونانی باستان، چندین قرن قبل‌تر از آنچه تصور می‌شد، به‌شکل مکتوب درآمده بود.

کار ونتریس یک دستاورد بسیار بزرگ بود. ولی زبان قدیمی‌تر، خطی الف، هنوز هم یکی از بزرگ‌ترین مسائل روز زبان‌شناسی باقی مانده‌ است.

دور از ذهن نیست که پیشرفت‌های اخیر بشر در ترجمه‌ی ماشینی، بتواند به پیش‌برد این مسئله کمک کند.

تنها در چند سال اخیر، مطالعات زبان‌شناسی به‌دلیل وجود پایگاه‌های داده‌ی تفسیری عظیم و روش‌هایی برای یادگیری ماشین از روی آن‌ها، دگرگون شده‌ است. درنتیجه‌ی این امر، ترجمه‌ی ماشینی یک زبان به زبان دیگر کار رایجی شده‌؛ هرچند نتایج بدون‌نقص نیست ولی این روش‌ها، راه‌های کاملا جدیدی برای فهمیدن زبان‌ها پیش‌روی انسان گذاشته‌اند.

حال با جیامینگ لو و رجینا بارزیلی از دانشگاه MIT و یوآن کائو از آزمایشگاه هوش‌مصنوعی گوگل در کالیفرنیا آشنا شوید. این تیم موفق‌ شده است تا یک سیستم یادگیری ماشینی طراحی کند که می‌تواند زبان‌های فراموش‌شده را رمزگشایی کند. آن‌ها برای اثبات درستی سیستم خود، با کمک آن زبان خطی ب را (برای اولین‌بار به‌صورت خودکار) رمزگشایی کردند. روش مورداستفاده‌ی آن‌ها با تکنیک‌های معمول ترجمه‌ی ماشینی بسیار متفاوت بود.

ابتدا لازم است کمی درباره‌ی نحوه‌ی عملکرد ترجمه‌ی ماشینی بدانیم. ایده‌ی بزرگی که ترجمه‌ی ماشینی را امکان‌پذیر می‌کند، این است که کلمات، فارغ از زبان آن‌ها، به شکل‌های مشابهی با یکدیگر رابطه دارند.

پس در آغاز فرایند، ابتدا این روابط در یک زبان مشخص به یکدیگر نگاشت داده‌ می‌شوند. این کار نیازمند یک پایگاه‌ داده‌ی عظیم از متون است. سپس یک ماشین در متون جست‌وجو می‌کند تا ببیند که هر کلمه، چقدر در کنار سایر کلمات دیده می‌شود. الگویی که از این مشاهدات استخراج می‌شود، نشانه‌ی منحصربه‌فردی است که یک کلمه را در یک فضای پارامتری چندبعدی مشخص می‌کند. به‌ عبارت‌ دیگر، هر کلمه را در این فضا می‌توان به‌شکل یک بردار دید، و این بردار است که با اعمال محدودیت‌های قوی، مشخص می‌کند یک کلمه در ترجمه‌های ارائه‌شده توسط این ماشین چگونه ظاهر شود.

این بردارها از چند قانون ساده‌ی ریاضی پیروی می‌کنند. به‌عنوان مثال: ملکه = زن + مرد - پادشاه. و یک جمله را در این فضا، می‌توان به‌شکل مجموعه‌ای از بردارهای پشت‌سرهم دید که هر یک دیگری را دنبال می‌کند تا گونه‌ای مسیر ایجاد شود.

اما ایده‌ی کلیدی که ترجمه‌ی ماشینی را ممکن می‌کند، این است که کلمات یک زبان، در زبان دیگر هم به همان نقاط مشابه در فضای پارامتری نظیر می‌شوند. این قضیه نگاشت یک-به-یک زبانی به زبان دیگر را امکان‌پذیر می‌کند.

بدین ترتیب، فرایند ترجمه‌ی یک جمله، به فرایند یافتن مسیرهای مشابه‌ هم در این دو فضا تبدیل می‌شود. ماشین حتی نیاز به دانستن این ندارد که جمله چه «معنایی» دارد.

بیشتر بدانید:الگوریتم ابداعی هوش مصنوعی گوگل

فرایند یادشده، شدیدا به پایگاه‌های داده‌ی بزرگ وابسته است. اما چند سال پیش، تیمی متشکل از چند محقق آلمانی نشان‌ داد که چگونه با کمک روشی مشابه و با استفاده از پایگاه‌های داده‌ی بسیار کوچک‌تر، می‌توان زبان‌های کمتر شناخته‌شده که داده‌ی متنی زیادی ندارند را هم ترجمه‌ کرد. در این روش، برای اعمال محدودیت باید به روشی متفاوت که تکیه‌ی زیادی بر داده ندارد، عمل‌ کرد.

حال لو و همکارانش یک قدم فراتر رفته‌اند تا نشان دهند که چگونه با کمک ترجمه‌ی ماشینی، می‌توان زبان‌هایی که کاملا فراموش شده‌اند را رمزگشایی کرد. محدودیت‌هایی که آن‌ها استفاده می‌کنند، براساس نحوه‌ی تکامل زبان‌ها در گذر زمان است.

ایده‌ی آن‌ها چنین است که هر زبانی تنها به‌شکل‌های معینی تغییر می‌کند. مثلا در دو زبانی که به‌هم مرتبط‌ هستند، علائم به‌شکل‌های مشابهی توزیع می‌شوند، کلمات مرتبط ترتیب حروف مشابهی دارند و... . با استفاده این قوانین در محدودیت‌های ماشین، خیلی ساده‌تر می‌توان یک زبان را رمزگشایی کرد. البته شرط آن، دانستن ریشه‌ی زبان ناشناخته است.

لو و همکارانش این تکنیک را با دو زبان فراموش‌شده‌ی خطی ب و اوگاریتی امتحان کردند. زبان‌شناسان می‌دانند که خطی ب از نسخه‌های ابتدایی یونانی باستان و اوگاریتی که در سال ۱۹۲۹ کشف شد، از نسخه‌های ابتدایی زبان عبری است.

با کمک این اطلاعات و محدودیت‌های اعمال‌شده براساس تکامل زبانی، ماشین لو و همکارانش می‌تواند هردوی این زبان‌ها را با دقت قابل‌توجهی ترجمه‌ کند. آن‌ها می‌گویند: «ما موفق‌شدیم ۶۷/۳ درصد از نمونه‌های زبان خطی ب را در سناریوی رمزگشایی به معادل یونانی آن‌ها ترجمه‌ کنیم. تا جایی که می‌دانیم، تجربه‌ی ما اولین تلاش برای ترجمه‌ی خودکار زبان خطی ب است.»

کار تحسین‌برانگیز لو و تیمش قطعا ترجمه‌ی ماشینی را به سطح کاملا جدیدی ارتقا داده‌ است. ولی سؤال جالبی درمورد سایر زبان‌های فراموش‌شده مطرح می‌شود؛ به‌خصوص آن‌هایی که مانند خطی الف هیچ‌گاه رمزگشایی نشده‌اند.

در مقاله‌ی این تیم، غیبت زبان خطی الف کاملا احساس می‌شود. لو و همکارانش حتی به آن اشاره هم نکرده‌اند؛ ولی قطعا ذهن آن‌ها را مانند هزاران زبان‌شناس دیگر به‌خود مشغول کرده‌ است. با این حال پیشرفت‌های قابل‌ملاحظه‌ای لازم است تا بتوان این زبان را توسط ماشین ترجمه کرد. به‌طور مثال، هیچ‌کس از ریشه‌ی زبان خطی الف اطلاعی ندارد. تلاش‌هایی که برای ترجمه‌ی آن به یونانی باستان صورت‌ گرفته، همگی شکست خورده‌اند. و این روش جدید بدون دانستن جد یک زبان کار نمی‌کند.

اما مزیت بزرگ روش‌های مبتنی‌برماشین این است که می‌توان زبان‌ها را یکی‌ پس‌ از دیگری و بدون خستگی امتحان کرد. درنتیجه ممکن‌ است لو و همکارانش زبان خطی الف را با روشی فراگیر (Brute-Force) رمزگشایی کنند؛ یعنی تلاش کنند تا آن‌ را به تمامی زبان‌هایی که در ترجمه‌ی ماشینی شناخته‌ شده است، ترجمه کنند. اگر موفق به انجام این کار بشوند، قطعا به دستاورد بزرگی رسیده‌اند. دستاوردی که حتی مایکل ونتریس را هم شگفت‌زده خواهدکرد.

+ 10

- 14