خانه / تکنولوژی / موفقیت هوش مصنوعی بایدو جلاجل درک زبان طبیعی

موفقیت هوش مصنوعی بایدو جلاجل درک زبان طبیعی

بایدو توسط هوش مصنوعی زبانی كلاه خود ERNIE موفق به مقصد صاحبخانه رتبه‌ای فراتر كره زمين ۹۰ جلاجل درک عملکرد زبان انسانی شد.

گردوخاک ماه جاری، بایدو، هيولا فناوری چینی، موفق شد بیشترین پتنت جلاجل مربوط به حوزه‌ی هوش مصنوعی را مندرج کند و مایکروسافت و گوگل را جلاجل هم چشمي كردن تنگاتنگ جلاجل این مربوط به حوزه خلف وعده‌كله دار گذاشت. بایدو که شماری آن را همتای چینی گوگل می‌دانند، بیشترین مندرج نوآوري و هم چشمي كردن را جلاجل مربوط به حوزه‌ی ارزشیابی درک زبان عمومی داشته باریک که به مقصد‌اقرار GLUE خوانده انجام خواهد شد.

مقاله‌های مرتبط:

GLUE بنچمارک شناساننده‌شده‌ و مقبولی جلاجل مربوط به حوزه‌ی مطالعه ها زبانی باریک که مشخص می‌کند هر سیستم هوش مصنوعی چقدر می‌تواند زبان انسانی را درک کند. این بنچمارک شامل ۹ تکلیف درک زبان طبیعی شامل نامیدن اسامی بيگانگان و دائم الخمر‌ها جلاجل يكباره و تشخیص محل بازگشت ضمایری چون «آن» جلاجل جملات باریک که مشخص کند به مقصد کدام‌یک كره زمين چندین نام مشخص جلاجل يكباره بازمی‌گردد. محرزشدن زبانی‌ای که جلاجل بهم نماه طبقه‌بندی GLUE بیشترین امتیاز را دارد، می‌تواند ازپسِ متنوع‌ترین تکالیف درک موضوع بحث زبانی نیز برآید. عملکرد درک زبان انسانی GLUE نمره‌ی ۸۷ كره زمين ۱۰۰ را صاحبخانه کرده باریک؛ اما اکنون بایدو توسط محرزشدن زبانی كلاه خود به مقصد‌غيرماذون ERNIE اولین‌ تیمی باریک که موفق شده كره زمين نمره‌ی ۹۰ فراتر رود.

بهم نماه طبقه‌بندی GLUE دائما جلاجل حلول كننده تغییر باریک و جای عجله كردن نخواهد صفت بويناك ارچه تیم دیگری به مقصد‌زودی جای بایدو را جلاجل مقام اولا بهم نماه ازآنِ كلاه خود کند. نکته‌ی درخورتوجه درزمينه‌ی موفقیت بایدو این باریک که اثر داغ می‌دهد اسم ابله تحقیقات هوش مصنوعی كره زمين گوناگوني مشارکت‌کنندگان سود می‌سرما. بنابراین، پژوهشگران هوش مصنوعی بایدو تکنیکی را به مقصد‌صفت منسوب به طوس خاص تعدادی زبان چینی به مقصد‌غيرماذون «بازنمود پیشرفته ازطریق یکپارچه‌سازی دانايي» ساخته‌بضع که به مقصد‌اقرار ERNIE خوانده انجام خواهد شد. این تکنیک به مقصد‌صفت منسوب به طوس خاص تعدادی زبان چینی طراحی شده باریک؛ اما همین تکنیک باعث عملکرد مرغوبيت درک زبان انگلیسی نیز شده باریک.

تاریخچه‌ی ERNIE

ERNIE ترقی كلاه خود را باید قدردان محرزشدن زبانی هوش مصنوعی گوگل به مقصد‌غيرماذون BERT باشد که توسط اله كره زمين این محرزشدن زبانی شکل گرفته باریک. گفتنی باریک ERNIE و BERT هر كورس توسط‌ غيرماذون شخصیت‌های Sesame Avenue غيرماذون‌گذاری شده‌بضع. قبل كره زمين ایجاد محرزشدن زبانی BERT، یعنی «بازنمود رمزگذار دوسویه‌ی زبانی كره زمين ترنسفورمرها (مبدل‌ها)»، جلاجل اواخر اسم باشليق ۲۰۱۸، محرزشدن‌های زبان طبیعی استريوفونيك حرفی تعدادی ذكرخير نداشتند.

مقاله‌های مرتبط:

محرزشدن‌های زبانی قبلی جلاجل پیش‌بینی کلمه‌ی بعدی جلاجل یک يكباره عملکرد نیکی داشتند؛ بنابراین، تعدادی اپلیکیشن‌هایی چون Autocomplete درخور اطفال بودند؛ اما آن‌ها حتی نمی‌توانستند مفهوم عبارتی کوتاه را جلاجل متنی کوچک صفت به خاطرسپردني کنند. دلیل این طفره مهتر آن صفت بويناك که محرزشدن‌های زبانی قبلی توانایی درک بامعني را نداشتند؛ بنابراین، هنگامی که توسط ضمیری مثل «آن» مواجه می‌شدند، نمی‌توانستند تشخیص دهند این ضمیر به مقصد کدام نام مشخص جلاجل يكباره اشاعت می‌کند.

جلاجل محرزشدن زبانی BERT همه‌چیز تغییر انجام بده. محرزشدن‌های قبلی زبانی، آموزش دیده بودند مادام بتوانند معنای واژه‌ی باطني بافندگي كردن و ساختارگرايي يكباره را باتوجه‌به مقصد واژه‌ی قبل یا پس ازآن كره زمين آن پیش‌بینی یا اعلامیه کنند؛ ولی هرگز نمی‌توانستند به مقصد‌لفظ هم‌زمان این کار را اعمال دهند؛ بنابراین، به مقصد آن‌ها محرزشدن زبانی تک‌سویه (Unidirectional Language Mannequin) كلام می‌شد.

این جلاجل حالی باریک که محرزشدن زبانی BERT جلاجل ساختارگرايي متنی می‌تواند قبل و پس ازآن كره زمين واژه‌ را به مقصد‌صفت منسوب به طوس هم‌زمان بررسی کند که به مقصد آن محرزشدن زبانی دوسویه (Bidirectional Language Mannequin) كلام انجام خواهد شد. این عمل جلاجل محرزشدن زبانی دوسویه توسط تکنیکی به مقصد‌غيرماذون Masking اعمال انجام خواهد شد. جلاجل بخش معینی كره زمين هر اسم ستيزه گر، BERT به مقصد‌صفت منسوب به طوس تصادفی ۱۵ درصد كره زمين کلمات را مخفی و آن وقت سعی می‌کند باتوجه‌به مقصد مفهوم و بامعني، کلمات مخفی‌شده را كره زمين باقی اسم ستيزه گر پیش‌بینی کند. چنین توانایی‌ای به مقصد BERT این امکان را می‌دهد مادام پیش‌بینی‌های دقیق‌تری اعمال دهد؛ کمک دومقابل زیادتر كره زمين آنچه تصورش را کنید، سرنخ دراختیار خواهد داشت. تعدادی همال، جلاجل يكباره‌ای چون «آن ناموس پرور تعدادی خرید شیر به مقصد …… رفت»، واژگانی که جلاجل ابتر شدن و پایان يكباره صور دارند، حاوی سرنخ‌هایی تعدادی کلمه‌ی صحیح جای‌ خالی هستند؛ یعنی سرنخ‌ها اشاعت می‌کنند واژه‌ی درخور اطفال جای‌ خالی باید غيرماذون مکانی باشد که می‌توان به مقصد آنجا رفت و شیر خرید. گفتنی باریک ترجمه‌ی يكباره به مقصد‌دلیل ساختارگرايي متفاوت قرارگرفتن فعل و گم شدن جلاجل فارسی به مقصد این شکل نوشته شده باریک و ترجمه‌ی واژه‌به مقصد‌واژه‌ی يكباره‌ی مذکور جلاجل زبان انگلیسی به مقصد‌لفظ «آن ناموس پرور به مقصد رفت ….. تعدادی خرید شیر» باریک.

كاربرد كره زمين تکنیک Masking یکی كره زمين بااستعداد‌ترین نوآوری‌ها درپس ترقی‌های چشمگیر تکالیف زبان طبیعی بوده باریک؛ به مقصد‌طوری‌که حتی دلیل موفقیت سیستم هوش مصنوعی تولیدکننده‌ی اسم ستيزه گر لابراتور تحقیقاتی OpenAI به مقصد‌غيرماذون GPT-2 نیز جلاجل همین امر باریک که می‌تواند غير كژي معنایی متون بسیار حقوقدان‌کننده و صحیحی اشکال کند.

كره زمين زبانی انگلیسی به مقصد چینی و دوباره برعکس

هنگامی ‌ه پژوهشگران بایدو توسعه‌ی محرزشدن زبانی كلاه خود را سرخرگ کردند، قصد داشتند محرزشدن زبانی كلاه خود را برپایه‌ی تکنیک Masking ایجاد کنند؛ اما متوجه شدند خودشان باید این تکنیک را چشم نواز توسط زبان چینی تغییر دهند.

Artificial Intelligence

جلاجل زبان انگلیسی، واژه به مقصد‌ديباچه يك جهت معنایی عمل می‌کند؛ به مقصد‌طوری‌که ارچه حتی واژه‌ای را کاملا كره زمين اسم ستيزه گر بیرون بکشیم، همچنان معنی‌دار باریک؛ درحالی‌که جلاجل زبان چینی این‌صفت منسوب به طوس نیست. زبان چینی الفبا ندارد و به مقصد‌جای آن حاوی زیاد كره زمين ۸۰ هزار نویسه باریک. زبان چینی کاملا نقاشی‌ای ‌باریک که به مقصد حروف تبدیل شده، تعدادی همین به مقصد زبان «شهرستان اندیشه‌نگار» یا «مفهوم‌گرا» نیز خنيدهنام باریک. جلاجل زبان چینی، شماری نویسه‌های خاص مثل آذريون (火, huŏ) و پيمان (水, shuĭ) و كنده (木, mù) معنای ذاتی و مستقل دارند؛ اما زیادتر نویسه‌ها مادام زمانی‌که توسط افزونتر نویسه‌ها ادغام و هم‌نشین نشوند، معنای ذاتی و مستقلی ندارند. تعدادی همال، نویسه‌ی چینی 灵) líng) باتوجه‌به مقصد هم‌نشینی‌اش توسط نویسههای افزونتر می‌تواند به مقصد‌معنای باهوش (机灵, jīlíng) یا روح (灵魂, línghún) باشد. حتی نویسههای موجود جلاجل اسامی خاص مثل بوستون (波士顿, bōshìdùn) یا ایالات متحده (美国, měiguó) نیز به مقصد بدون شك معنایی نیستند که یک‌شهرستان بار جداگانه كاربرد شدند.

بنابراین، پژوهشگران محرزشدن زبانی ERNIE را توسط نسخه‌ی جدیدی كره زمين تکنیک masking آموزش دادند مادام بتواند لفافه‌ای كره زمين نویسهها را به مقصد‌جای یک نویسه مخفی ‌کند. آن‌ها در عرض ERNIE را آموزش دادند بین لفافه‌های عنبرين و تصادفی تفاوت قائل شود مادام بتواند ترکیب نویسه‌ی درخور اطفال را به موجب تکنیک Masking تشخیص دهد؛ درنتیجه، محرزشدن زبانی ERNIE درک بیشتری كره زمين نحوه‌ی رمزگذاری دانسته ها جلاجل زبان چینی و پیش‌بینی بسیار دقیق‌تری جلاجل قطعات هدر (جای‌ خالی جلاجل جملات) به مقصد‌دستگاه بافندگي آورد. چنین دستاوردی تعدادی اپلیکیشن‌هایی جلاجل مربوط به حوزه‌هایی مثل ترجمه و بازیابی دانسته ها كره زمين قواله متنی مفید خواهد صفت بويناك.

افزون‌براین، پژوهشگران به مقصد‌شتاب دریافتند دراصل این رویکرد تعدادی زبان انگلیسی نیز عملکرد بسیار بهتری دارد؛ چراکه جلاجل زبان انگلیسی نیز مثل زبان چینی، اما به مقصد‌‌فك خير به مقصد‌اندازه‌ی زبان چینی، مواردی صور دارد که هم‌نشینی لفافه‌ای (تعدادی) كره زمين واژگان تواماً معنای متفاوت و جداگانه‌ای كره زمين معنای تک‌تک واژگان تبرئه می‌دهند. تعدادی همال، توسط درک معنای تک‌تک کلمات جلاجل اسامی خاصی چون Harry Potter (هری پاتر) و عبارات و اصطلاحاتی مثل chip off the previous block (‌به مقصد مامان یا باباش رفته) نمی‌توان معنای اصلی را پی‌و‌واپسین انجام بده. بنابراین، تعدادی يكباره‌ی «هری پاتر كلكسيون‌ای كره زمين نوول‌های سبک خیال‌پردازی و فانتزی باریک که توسط جی.کی. رولینگ یا نوشته شده باریک»، محرزشدن زبانی BERT به موجب تکنیک Masking، ممکن باریک آن را به مقصد‌ این لفظ واپسین کند: «[mask] پاتر كلكسيون‌ای [mask] نوول‌های خیال‌پردازی و فانتزی [mask] توسط جی [mask] رولینگ». درحالی‌که محرزشدن زبانی ERNIE ثمار ازاصل تکنیک Masking، این يكباره را به مقصد‌ این لفظ  واپسین می‌کند: «هری پاتر هست [mask] [mask] [mask] نوول‌های فانتزی توسط [mask] [mask] [mask]». بنابراین، مشخص باریک که ERNIE پیش‌بینی‌های قوی‌تری به موجب بامعني به مقصد‌جای كاربرد كره زمين الگوهای آماری کلمات یاد گرفته باریک.

ایده‌های متنوع

Baidu Brain

نهایی نسخه‌ی محرزشدن زبانی ERNIE كره زمين چندین تکنیک آموزش افزونتر نیز ثنايا‌مند شده باریک. به مقصد‌ديباچه مثال، ترتیب جملات و فواصل قرارگرفتن بین آن‌ها (یعنی يكباره‌ی «هزار» باتوجه‌به مقصد بامعني پس ازآن كره زمين تاچند يكباره‌ی افزونتر تعدادی تکمیل معنای پاراگراف پس ازآن كره زمين يكباره‌ی «ب» باید آورده شود) را تعدادی درک ترقی منطقی پاراگراف جلاجل نگاه خشم آلود می‌گیرد. كره زمين همه‌ی این‌ها بااستعداد‌نمناك، محرزشدن زبانی ERNIE كره زمين روشی به مقصد‌غيرماذون آموزش مداوم ثنايا می‌سرما که به مقصد آن امکان می‌دهد آموزش روی داده‌های جدید و تکالیف جدید زبانی را غير فراموش‌وزیر ها مواردی فراگیرد که قبلا پرورش دادن باریک. این امر به مقصد ERNIE این امکان را می‌دهد مادام جلاجل اعمال طیف وسیعی كره زمين تکالیف زبانی توسط گذشت زمان و محض اين كه باغ ها صفت دوده‌های انسانی عملکرد بهتری داشته باشد.

تيرخور بایدو، هيولا موتور جست‌وجوی چینی، كره زمين ارتقای محرزشدن زبانی ERNIE ارائه‌ی نتایج جست‌وجوی کاربردی‌نمناك به مقصد کاربران و حذف شدني موضوع ها تکراری جلاجل فید خبرنامه‌ی كلاه خود و به شدني توانایی دستیار هوش مصنوعی‌اش، یعنی Xiao Du، جلاجل جواب‌گویی دقیق به مقصد بايسته‌ها باریک. در عرض، جدیدترین معماری محرزشدن زبانی ERNIE جلاجل شکل مقاله‌ای جلاجل کنفرانس اسم باشليق آینده‌ی تين ترقی‌های هوش مصنوعی ارائه خواهد شد. پژوهشگران امیدوارند بدون شك‌نوع که تیمشان جلاجل ساخت محرزشدن زبانی BERT گوگل موفق بوده، دیگران نیز كره زمين نتایج و دستاوردهای کار توسط محرزشدن زبانی ERNIE ثنايا‌مند شوند.

هائو تیان، معمار اصلی تحقیقات بایدو گفت:

وقتی اولین‌شهرستان بار این کار را سرخرگ کردیم، به مقصد‌صفت منسوب به طوس خاص احكام روی پیاده‌سازی نویسههای زبان چینی فکر می‌کردیم؛ اما به مقصد‌شتاب دریافتیم فراتر كره زمين آن نیز اجراشدنی باریک.

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *