با وجود گذشت دهها سال از ظهور اولین نرمافزارهای پیشرفتهی صنعتی، یادگیری ماشین هنوزهم برای عملکرد بهینه و بدون خطا نیازمند مداخلهی انسانی است.
پس از گذشت چهار دهه از زمان کاربرد اولین نرمافزار پیشرفته در صنایع داراییبر مانند تأسیسات، فرودگاهها، بندرگاهها، جادهها، خطآهن و معدن، تولیدکنندگان مسیری درخورتوجه بهمنظور تحول کسبوکار خود و تولید ارزشافزوده برای ذینفعان طی کردهاند. صنایع داراییبر صنایعی هستند که وابستگی زیادی به داراییهای فیزیکی خود دارند.
امروزه، بهلطف پیشرفتهای هوش مصنوعی، بهویژه یادگیری ماشین، نسل جدیدی از فناوریها ظهور کردهاند که فرصتهای جدیدی برای برتری عملیاتی در بخشهای صنعتی بهوجود آوردهاند. کسبوکارها برای سبقت از یکدیگر، نهتنها باید پیچیدگیهای یادگیری ماشین را درک کنند؛ بلکه باید براساس آن عمل کنند و بدینترتیب به مزیت برسند.
ناگفته نماند آخرین راهحلهای یادگیری ماشین میتوانند چند هفته زودتر به وجود خرابی یا نقص در داراییها پی ببرند و با تشخیص الگوهای دادهای پیچیده و کشف آثار دقیق خرابی یا نقص، تجهیزات ناهنجار را از تجهیزات عادی تفکیک کنند.
مایک بروکز، مدیر ارشد شرکت نرمافزاری بهینهسازی اسپنتِک (AspenTech)، در این باره میگوید:
سیستمهای یادگیری ماشین میتوانند به اپراتورها هشدار دهند و برای دوری از خطاهای احتمالی یا کاهش پیامدها، راهحلهایی تعریف کنند. روش یادگیری ماشین بدون ناظر، روشی مختص الگوهای یادگیری عملکرد یا رفتار است که از تکنیکهای دستهبندی استفاده میکند.
علاوهبراین، در این قبیل سیستمها میتوان براساس سیگنالهای دریافتی از حسگرها و ماشینها رفتارهای عملیاتی را درک کرد و پس از یادگیری الگوهای رفتاری و تحلیل دادههای جدید، به انحرافها یا ناهنجاریها پی برد. درنهایت، با پیبردن به ناهنجاریها میتوان مشکلات مکانیکی و تغییرات فرایند تأثیرگذار بر بخشهای مختلف تجهیزات را شناسایی کرد. بااینحال، ممکن است روش یادگیری بدون ناظر پر از خطا باشد و همیشه به مداخلهی انسان نیاز داشته باشد. بروکز معتقد است:
این روش در کشف همبستگیها عملکرد خوبی دارد؛ اما کاراییاش در علتیابی مشکل کمتر است. یادگیری ماشین بدون دخالت انسان صرفا میتواند همبستگیهای بیمعنی، ولی واقعی مثل رابطهی کاهش مرگ در بزرگراههای ایالات متحده و واردات لیمو از مکزیک را پیدا کند.
وقتی یادگیری ماشین بدون ناظر موفق میشود ناهنجاری را کشف کند، تغییر در الگوی رفتاری دو حالت دارد: وضعیت عملیاتی جدید یا بروز خطای احتمالی. اینجا است که عاملی انسانی باید ماشین را بررسی و برای انتخاب گزینهی صحیح تصمیمگیری کند. مداخلهی دستی به قابلیت تطبیق و یادگیری سیستم کمک میکند و تحلیلی مطمئن برای کسبوکار ارائه میکند.
افزونبراین، همبستگی (Correlation) با علتیابی (Causation) یکسان نیست؛ بنابراین، یادگیری ماشین برای یادگیری صحیح به راهنمای انسانی نیاز دارد. برای مثال، فناوریهای تشخیص صدا از یادگیری ماشین استفاده میکنند؛ اما بدون کمک نمیتوانند یاد بگیرند. دستیارهای شخصی هم برای تفسیر عبارتهای پردازشنشده و ترجمهی آنها به ناظران انسانی نیاز دارند.
بهطور مشابه، قابلیت کشف فریب کارت اعتباری باید رفتار خرید را یاد بگیرد. ممکن است شرکت کارت اعتباری بپرسد: «آیا میخواهید بلیت هواپیما را در پاریس بخرید؟» در این صورت صادرکنندهی کارت اعتباری از یادگیری ماشین برای درک الگوهای عادی خرید استفاده میکند و بدینترتیب رفتار ناهنجار را تشخیص میدهد. بروکز میگوید:
ورودی سادهی بله یا خیر، برای تشخیص ناهنجاری کافی است و رفتارهای خرید عادی را از رفتارهای فریبدهنده تفکیک میکند.
به همین ترتیب، یادگیری ماشین بدون ناظر برای عملکرد مؤثر نیازمند مداخلهی انسان است و باید رویداد و زمان و تاریخ آن را برای آن تعریف کرد. علاوهبراین، فناوری باید نشان الگوهای دقیقی را شناسایی کند که به اتفاق منجر میشوند. برای مثال، این الگوها در صنایع داراییبر میتوانند به نقص در دستگاهها منجر شوند. بروکز دربارهی این موضوع میگوید:
فناوری در درجهی اول به یادگیری و ارزیابی الگوی خطا میپردازد. سپس، برای یافتن احتمال دقیق بازگشت الگو، جریانهای دادهای ورودی را آزمایش میکند. در مرحلهی بعد، قبل از وقوع خطا هشدار میدهد و زمان لازم را برای رفع خطا یا تعمیر قبل از وقوع خسارت بزرگ فراهم میکند. بدینترتیب، هزینهی نگهداری کاهش مییابد و محصولات ارزشمندتری تولید میشوند.
چشماندازهای درخشان
موریس با تأکید بر مزایای یادگیری ماشین در راهاندازی بهینهی تأسیسات و بهینهسازی عملکرد موجودیها، صاحبان کسبوکارهای داراییبر را به استفاده از این فناوری تشویق میکند. در بازارهای شلوغ امروزی، فرصت استفاده از یادگیری ماشین و مزایای آن برای پیشبینی عملکرد دارایی و افزایش مزایای کسبوکار و توسعهی مرز رقابتی بهوجود آمده است. موریس معتقد است:
یادگیری ماشین از نوع بدون نظارت، میتواند به کسبوکارها در شناسایی ناهنجاریها و عملکرد کمک کند؛ اما سازمانها باید آگاه باشند که یادگیری ماشین برای عملکرد در سطوح بهینه نیازمند هوش و راهنمایی انسانی است. یادگیری ماشین هنوز برای یافتن و حل مشکلات به راهنما نیاز دارد.
کسبوکارهای داراییبر که به درک صحیحی از مزایای یادگیری ماشین میرسند، به بهترین شکل میتوانند از مزایای آن برخوردار شوند و با ارزیابی الگوهای رفتاری دارایی و رسیدن به دیدگاه صحیح و توسعهی خودکار چشمانداز، عملکرد دارایی در کل عملیات خود را میتوانند بهینهسازی کنند.
استفاده از یادگیری ماشین برای ترجمه زبانهای فراموش شده
گروهی از محققان موفق شدند با استفاده از ترجمهی ماشینی، یکی از زبانهای فراموششدهی دنیا را بهصورت خودکار رمزگشایی کنند.
در سال ۱۸۸۶، باستانشناسی بریتانیایی بهنام آرتور اِونز، به سنگی باستانی برخورد که حامل حکاکیهایی جالب به زبانی ناشناخته بود. این سنگ متعلق به جزیرهی مدیترانهای کرت (Crete) بود و اونز برای یافتن شواهد بیشتر، بلافاصله به آنجا سفر کرد. طولی نکشید که او تعداد زیادی سنگ و لوح که همگی حکاکیهای مشابهی داشتند، پیدا کرد و آنها را متعلق به ۱۴۰۰ سال پیش از میلاد مسیح دانست.
این سنگنوشتهها حامل یکی از قدیمیترین خطهای کشفشده بودند. اونز عقیده داشت که فرم خطی این زبان، ریشه در تصاویر خطی دوران اولیهی هنر دارد؛ درنتیجه از اهمیت بسیار زیادی در تاریخ زبانشناسی برخوردار است.
او و چند دانشمند دیگر متوجهشدند که این سنگها و لوحها به دو زبان متفاوت نوشته شده بودند. زبان قدیمیتر که به آن «خطی الف (Linear A)» میگویند، مربوط به سالهای ۱۴۰۰ تا ۱۸۰۰ پیش از میلاد است؛ زمانی که جزیره تحت سلطهی تمدن مینوسی در دوران برنز بود.
زبان دیگر که «خطی ب (Linear B)» نام دارد، جدیدتر بوده و در سالهای پس از ۱۴۰۰ پیش از میلاد و در دوران سلطهی میکاییهای یونان، پدید آمده است.
اونز و همکارانش تلاش بسیاری کردند تا این زبانهای باستانی را رمزگشایی کنند ولی هیچیک از تلاشهای آنان به نتیجه نرسید. این مشکل حلنشده باقی ماند تا اینکه در سال ۱۹۵۳، یک زبانشناس تازهکار بهنام مایکل وِنتریس موفق شد زبان خطی ب را رمزگشایی کند.
راهکار او مبتنی بر دو پیشرفت تعیینکننده بود. اول اینکه ونتریس حدس زد بخش زیادی از کلمات تکرارشده در زبان خطی ب، نام مکانهایی در جزیرهی کرت بود. حدس او درست بود.
پیشرفت دوم او این بود که فرض کرد این زبان، فرمی ابتدایی از زبان یونانی باستان بود. این دید باعث شد که او بتواند بهسرعت سایر زبان را هم رمزگشایی کند. طی این فرایند، ونتریس نشان داد که یونانی باستان، چندین قرن قبلتر از آنچه تصور میشد، بهشکل مکتوب درآمده بود.
کار ونتریس یک دستاورد بسیار بزرگ بود. ولی زبان قدیمیتر، خطی الف، هنوز هم یکی از بزرگترین مسائل روز زبانشناسی باقی مانده است.
دور از ذهن نیست که پیشرفتهای اخیر بشر در ترجمهی ماشینی، بتواند به پیشبرد این مسئله کمک کند.
تنها در چند سال اخیر، مطالعات زبانشناسی بهدلیل وجود پایگاههای دادهی تفسیری عظیم و روشهایی برای یادگیری ماشین از روی آنها، دگرگون شده است. درنتیجهی این امر، ترجمهی ماشینی یک زبان به زبان دیگر کار رایجی شده؛ هرچند نتایج بدوننقص نیست ولی این روشها، راههای کاملا جدیدی برای فهمیدن زبانها پیشروی انسان گذاشتهاند.
حال با جیامینگ لو و رجینا بارزیلی از دانشگاه MIT و یوآن کائو از آزمایشگاه هوشمصنوعی گوگل در کالیفرنیا آشنا شوید. این تیم موفق شده است تا یک سیستم یادگیری ماشینی طراحی کند که میتواند زبانهای فراموششده را رمزگشایی کند. آنها برای اثبات درستی سیستم خود، با کمک آن زبان خطی ب را (برای اولینبار بهصورت خودکار) رمزگشایی کردند. روش مورداستفادهی آنها با تکنیکهای معمول ترجمهی ماشینی بسیار متفاوت بود.
ابتدا لازم است کمی دربارهی نحوهی عملکرد ترجمهی ماشینی بدانیم. ایدهی بزرگی که ترجمهی ماشینی را امکانپذیر میکند، این است که کلمات، فارغ از زبان آنها، به شکلهای مشابهی با یکدیگر رابطه دارند.
پس در آغاز فرایند، ابتدا این روابط در یک زبان مشخص به یکدیگر نگاشت داده میشوند. این کار نیازمند یک پایگاه دادهی عظیم از متون است. سپس یک ماشین در متون جستوجو میکند تا ببیند که هر کلمه، چقدر در کنار سایر کلمات دیده میشود. الگویی که از این مشاهدات استخراج میشود، نشانهی منحصربهفردی است که یک کلمه را در یک فضای پارامتری چندبعدی مشخص میکند. به عبارت دیگر، هر کلمه را در این فضا میتوان بهشکل یک بردار دید، و این بردار است که با اعمال محدودیتهای قوی، مشخص میکند یک کلمه در ترجمههای ارائهشده توسط این ماشین چگونه ظاهر شود.
این بردارها از چند قانون سادهی ریاضی پیروی میکنند. بهعنوان مثال: ملکه = زن + مرد - پادشاه. و یک جمله را در این فضا، میتوان بهشکل مجموعهای از بردارهای پشتسرهم دید که هر یک دیگری را دنبال میکند تا گونهای مسیر ایجاد شود.
اما ایدهی کلیدی که ترجمهی ماشینی را ممکن میکند، این است که کلمات یک زبان، در زبان دیگر هم به همان نقاط مشابه در فضای پارامتری نظیر میشوند. این قضیه نگاشت یک-به-یک زبانی به زبان دیگر را امکانپذیر میکند.
بدین ترتیب، فرایند ترجمهی یک جمله، به فرایند یافتن مسیرهای مشابه هم در این دو فضا تبدیل میشود. ماشین حتی نیاز به دانستن این ندارد که جمله چه «معنایی» دارد.
بیشتر بدانید:الگوریتم ابداعی هوش مصنوعی گوگل
فرایند یادشده، شدیدا به پایگاههای دادهی بزرگ وابسته است. اما چند سال پیش، تیمی متشکل از چند محقق آلمانی نشان داد که چگونه با کمک روشی مشابه و با استفاده از پایگاههای دادهی بسیار کوچکتر، میتوان زبانهای کمتر شناختهشده که دادهی متنی زیادی ندارند را هم ترجمه کرد. در این روش، برای اعمال محدودیت باید به روشی متفاوت که تکیهی زیادی بر داده ندارد، عمل کرد.
حال لو و همکارانش یک قدم فراتر رفتهاند تا نشان دهند که چگونه با کمک ترجمهی ماشینی، میتوان زبانهایی که کاملا فراموش شدهاند را رمزگشایی کرد. محدودیتهایی که آنها استفاده میکنند، براساس نحوهی تکامل زبانها در گذر زمان است.
ایدهی آنها چنین است که هر زبانی تنها بهشکلهای معینی تغییر میکند. مثلا در دو زبانی که بههم مرتبط هستند، علائم بهشکلهای مشابهی توزیع میشوند، کلمات مرتبط ترتیب حروف مشابهی دارند و... . با استفاده این قوانین در محدودیتهای ماشین، خیلی سادهتر میتوان یک زبان را رمزگشایی کرد. البته شرط آن، دانستن ریشهی زبان ناشناخته است.
لو و همکارانش این تکنیک را با دو زبان فراموششدهی خطی ب و اوگاریتی امتحان کردند. زبانشناسان میدانند که خطی ب از نسخههای ابتدایی یونانی باستان و اوگاریتی که در سال ۱۹۲۹ کشف شد، از نسخههای ابتدایی زبان عبری است.
با کمک این اطلاعات و محدودیتهای اعمالشده براساس تکامل زبانی، ماشین لو و همکارانش میتواند هردوی این زبانها را با دقت قابلتوجهی ترجمه کند. آنها میگویند: «ما موفقشدیم ۶۷/۳ درصد از نمونههای زبان خطی ب را در سناریوی رمزگشایی به معادل یونانی آنها ترجمه کنیم. تا جایی که میدانیم، تجربهی ما اولین تلاش برای ترجمهی خودکار زبان خطی ب است.»
کار تحسینبرانگیز لو و تیمش قطعا ترجمهی ماشینی را به سطح کاملا جدیدی ارتقا داده است. ولی سؤال جالبی درمورد سایر زبانهای فراموششده مطرح میشود؛ بهخصوص آنهایی که مانند خطی الف هیچگاه رمزگشایی نشدهاند.
در مقالهی این تیم، غیبت زبان خطی الف کاملا احساس میشود. لو و همکارانش حتی به آن اشاره هم نکردهاند؛ ولی قطعا ذهن آنها را مانند هزاران زبانشناس دیگر بهخود مشغول کرده است. با این حال پیشرفتهای قابلملاحظهای لازم است تا بتوان این زبان را توسط ماشین ترجمه کرد. بهطور مثال، هیچکس از ریشهی زبان خطی الف اطلاعی ندارد. تلاشهایی که برای ترجمهی آن به یونانی باستان صورت گرفته، همگی شکست خوردهاند. و این روش جدید بدون دانستن جد یک زبان کار نمیکند.
اما مزیت بزرگ روشهای مبتنیبرماشین این است که میتوان زبانها را یکی پس از دیگری و بدون خستگی امتحان کرد. درنتیجه ممکن است لو و همکارانش زبان خطی الف را با روشی فراگیر (Brute-Force) رمزگشایی کنند؛ یعنی تلاش کنند تا آن را به تمامی زبانهایی که در ترجمهی ماشینی شناخته شده است، ترجمه کنند. اگر موفق به انجام این کار بشوند، قطعا به دستاورد بزرگی رسیدهاند. دستاوردی که حتی مایکل ونتریس را هم شگفتزده خواهدکرد.