حسگرهای یادگیری ماشین: هوش مصنوعی واقعاً مبتنی بر داده

یادگیری ماشینی در سال های اخیر شاهد انشعاب به سمت مدل های کوچکتر و بزرگتر بوده است. مدلهای زبانی در مقیاس بزرگ با صدها میلیارد پارامتر به طور منظم منتشر میشوند، و بدون هیچ نشانهای از اشباع عملکرد، میتوان انتظار داشت که این روند ادامه یابد.
از طرف دیگر، زمینه یادگیری ماشین کوچک (TinyML) – استقرار مدلهای یادگیری ماشین بر روی میکروکنترلرهای محدود به منابع – نیز در حال گسترش است. برنامه های تجاری برای TinyML در حال حاضر وجود دارد، از شناسایی کلمات کلیدی در تلفن های هوشمند (به عنوان مثال، “Hey Siri” و “OK Google”) تا تشخیص شخص برای کنترل روشنایی هوشمند، HVAC، و سیستم های امنیتی.
این انشعاب، فلسفه های رقیب هوش مصنوعی محاسبات محور و داده محور را به تصویر می کشد. در حالی که مدلهای در مقیاس بزرگ که در فضای ابری تعبیه شدهاند، تجسم شدید هوش مصنوعی محاسباتی هستند، هوش مصنوعی دادهمحور تاکنون توسط معماری سیستم سنتی محدود شده است. با در نظر گرفتن این فلسفه، باید قدرت محاسباتی را مستقیماً در جایی قرار دهیم که داده ها تولید می شوند. سنسور یادگیری ماشین را وارد کنید.
سنسور ML
پارادایم حسگر ML از مفهوم « نرمافزار ۲٫۰ » آندری کارپاتی الهام میگیرد – حرکت نرمافزار کاملاً تعریفشده و مبتنی بر قانون که در حال حاضر با آن آشنا هستیم (بهعنوان نرمافزار ۱٫۰ توصیف میشود) به سمت نرمافزار «هوشمندتر» که در قالبی کمتر قابل تفسیر کدگذاری شده است. روشی مانند وزن شبکه عصبی.
در مسیری مشابه، میتوانیم نمونه سختافزاری موجود از ML تعبیهشده را تصور کنیم که الگوی «حسگر ۱٫۰» یا «جاسازیشده ML 1.0» را در بر میگیرد – داشتن دادههای حسگر به CPU که در آن پردازش مدل انجام میشود. در مقابل، پارادایم حسگر ML «سنسور ۲٫۰» یا «امال ۲٫۰ تعبیهشده» را در بر میگیرد، جایی که پردازش روی خود سنسور انجام میشود و فقط اطلاعات سطح بالاتر و پردازش شده قبلی به CPU ارسال میشود.
بر اساس این، یک سنسور ML می تواند به صورت زیر تعریف شود:
حسگر ML یک سیستم مستقل است کهاز یادگیری ماشینی روی دستگاه برای استخراجاطلاعات مفید با مشاهده مجموعهای پیچیده ازپدیدهها در دنیای فیزیکی و گزارش آناز طریق یک رابط ساده به یک سیستم گستردهتر استفاده میکند.
با توجه به تعریف فوق، این با یک دستگاه IoT تفاوت دارد زیرا دستگاه نیازی به اتصال به اینترنت ندارد و از ML روی دستگاه به جای پردازش ابری استفاده می کند. این نیز متفاوت از یک سنسور استاندارد پیکربندی شده در کنار TinyML است زیرا پردازش مستقیماً روی سنسور انجام می شود، همانطور که در زیر نشان داده شده است.


این تمایز ممکن است ناچیز و بی اهمیت به نظر برسد، اما این رویکرد به چند دلیل عملی سودمند است.
رابط بدون اصطکاک هدف کلی سنسورهای ML انتزاع مشخصات ML از کاربر نهایی است. از منظر سختافزاری، افراد برای ساختن دستگاههایی که دارای آن هستند، نیازی به متخصص در ML ندارند. با افزایش سطح انتزاع، اصطکاک ترکیب هوش مصنوعی در سیستم های سخت افزاری موجود برای افراد غیر متخصص نیز کاهش می یابد. اگر نیاز به سفارشیسازی باشد، مانند تنظیم الگوریتم تشخیص چهره برای تشخیص چهره شما و شخص دیگری، نباید کاربر را ملزم به بارگذاری محیط پایتون و انجام آموزش مدل یا انتقال یادگیری کند.
مستقل و مدولار. سخت افزار و نرم افزار لزوما در حسگر ML مستقل و ماژولار هستند. تصور کنید که به یک فروشگاه می روید و یک ماژول «ردیاب شخص» می خرید، به همان روشی که ممکن است یک سنسور مادون قرمز یا دما بخرید. این ماژولار بودن به آنها اجازه می دهد تا به راحتی در الکترونیک بدون نیاز به تخصص در حوزه ML ادغام شوند.
حریم خصوصی و امنیت. ضمانتهای امنیتی و حریم خصوصی قویتری را میتوان در حسگرهای ML نسبت به یک جریان کاری سنتیتر ارائه کرد، زیرا اطلاعات حساس هرگز نباید دستگاه را ترک کنند. در حالی که این به وضوح برای داده های ویدیویی و صوتی اعمال می شود، در اصل، این می تواند برای هر داده حسگر اعمال شود.
ترکیب پذیری. اغلب، زمانی که مهندسان یک سیستم را طراحی و میسازند، برای حل یک مشکل خاصتر، مانند کنترل حرکت وسیله نقلیه، باید حسگرها را به روشی خاص ترکیب کنند. ماهیت ماژولار یک حسگر ML اجازه می دهد تا این امر به طور مشابه به دست آید. مهمتر از آن، سنسورهای ML را می توان با سنسورهای سنتی غیر ML و همچنین سایر حسگرهای ML ترکیب کرد تا راهکارهای کاربردی افزوده ایجاد شود.
به عنوان نمونه ای از ترکیب پذیری، یک سناریوی ساده را تصور کنید که در آن می خواهیم یک سیستم درب هوشمند ایجاد کنیم که فقط درب ورودی را به روی صاحب خانه باز می کند. این سیستم به (۱) راهی نیاز دارد تا سیستم بداند چه زمانی شخصی در درب منزل است، (۲) راهی برای سیستم برای دانستن اینکه آیا شخصی که در درب خانه است، مالک است و (۳) راهی برای غیرفعال کردن قفل در.
اولین چالش را می توان با استفاده از یک تراشه آشکارساز شخص حل کرد. سپس این خروجی را می توان با یک “تراشه” دوم که تشخیص چهره را انجام می دهد ترکیب کرد. برای برنامههای کاربردی معمولاً ترکیبی مانند این، مدلها را میتوان در یک حسگر ML جمع کرد و مدل تشخیص شخص ساخته شده و از یک مجموعه آموزشی منبع باز مانند مجموعه دادههای کلمات بیدار بصری به دستگاه فلش شد . به طور مشابه، مدل تشخیص چهره را می توان با استفاده از یک مدل سفارشی شده از طریق یادگیری چند شات آموزش داد. این سنسور می تواند در یک سیستم قفل الکترونیکی استاندارد ادغام شود، با خروجی سنسور ML که با مکانیسم قفل در تعامل است.
مزایای رویکرد فوق این است که (۱) معمار نیازی به دانستن هیچ چیز در مورد یادگیری ماشین برای ساختن سیستم ندارد، زیرا جنبه های ML از کاربر انتزاع شده است، (۲) ما از ترکیب سنسورها برای ایجاد راه حلی بیشتر استفاده کردیم . مشکل خاصی از «تشخیص شخص» نیست، و (۳) دادههای ما نیازی به رفتن به جایی نداشت، به این معنی که سیستم حفظ حریم خصوصی بود و حداقل خطرات امنیتی را به همراه دارد. علاوه بر این، از منظر مقیاس پذیری ، پیکربندی هزاران درب هوشمند در صورتی که با حسگرهای ML پیکربندی شده باشند، بسیار آسان تر از تنظیم محیط محاسباتی برای هر یک به صورت دستی است.
برگه های اطلاعات
سنسورهای سنتی دارای یک دیتاشیت هستند، مانند این . یک دیتاشیت مشابه باید با سنسور ML ارائه شود. چرا؟ خوب، وقتی کسی یک سنسور میخرد، عمدتاً میخواهد بداند که آیا برای کاربرد خاص آنها کار میکند یا خیر – اگر میدانستید که زیر نقطه جوش آب ذوب میشود، یک سنسور دما برای کتری خود نمیخرید؟
این برای سنسور ML تفاوتی ندارد. برای یک آشکارساز شخص، ما میخواهیم مطمئن شویم که حسگر در محیط فیزیکی که آن را مستقر خواهیم کرد، کار میکند. این ممکن است نیاز به فکر کردن در مورد ویژگی هایی داشته باشد که بر مدل تأثیر می گذارد، مانند محیط روشنایی یا فاصله ای که فرد از سنسور خواهد داشت. با این حال، ممکن است نیاز به در نظر گرفتن ویژگیهای سختافزاری مانند دمای عملیاتی، مصرف انرژی و استنتاج در ثانیه داشته باشد.
با توجه به خرد جامعه حسگرها، منطقی است که حسگرهای ML شامل یک برگه داده باشند که شامل این ویژگی های سخت افزاری و مدل باشد. به این ترتیب، یک کاربر نهایی بالقوه میتواند بررسی کند که آیا این برای کاربرد آنها منطقی است یا خیر و همچنین میتواند اطمینانهایی در مورد عملکرد دستگاه دریافت کند. این همچنین ممکن است به دلیل شفافیت بیشتر، اعتماد به مدلهای اساسی را بهبود بخشد، بهویژه اگر دادهها توسط نهادهای شخص ثالث تأیید شده باشند و دارای گواهینامهها یا تأییدیههای دیگری باشند.
در زیر یک مثال گویا از این که برگه داده حسگر ML برای یک ماژول آشکارساز شخص چگونه به نظر می رسد آورده شده است. توجه داشته باشید که این شامل بخشهایی است که در برگههای داده حسگر سنتی دیده میشود، و همچنین بخشهای اضافی برای تشریح عملکرد مدل ML، تجزیه و تحلیل عملکرد انتها به انتها، و به وضوح ویژگیهای مربوط به حفظ حریم خصوصی، اخلاقی و ملاحظات محیطی را بیان میکند.

یک مثال گویا از صفحه داده سنسور ML. در بالا، ما مواردی را داریم که در حال حاضر در دیتاشیتهای استاندارد یافت میشوند: توضیحات، ویژگیها، موارد استفاده، نمودارها و فاکتور شکل، ویژگیهای سختافزار، و مشخصات ارتباطی و پینآت. در پایین، موارد جدیدی را داریم که باید در برگه داده حسگر ML گنجانده شوند: ویژگیهای مدل ML، برچسب تغذیه مجموعه داده، تجزیه و تحلیل اثرات محیطی، و تجزیه و تحلیل عملکرد انتها به انتها. در حالی که ما این برگه داده را با ترکیب ویژگیها و دادهها از ترکیبی از منابع در یک نمونه گویا یک صفحهای فشرده کردیم، در یک دیتاشیت واقعی، فرض میکنیم که هر یک از این بخشها طولانیتر بوده و شامل متن توضیحی اضافی برای افزایش شفافیت دستگاه میشود. کاربران نهایی
زیست بوم
می توان اکوسیستم حسگر ML را به عنوان منبع بسته، منبع باز یا ترکیبی از این دو تصور کرد. برای هر یک از این رویکردها مزایا و معایبی وجود دارد. مشابه اینکه چگونه توسعه منبع باز برای ML و سایر نرم افزارها به طور بنیادی اکوسیستم نرم افزار را متحول کرده است، یک اکوسیستم متن باز که حسگرهای ML را احاطه کرده است احتمالاً سرعت و نوآوری حسگرهای ML را تسریع می کند.
مشابه پروژههای ML منبع باز بزرگ مانند TensorFlow و Keras، میتوان اکوسیستم مشابهی را برای ساخت حسگرهای قوی ML برای همهجایترین کاربردها، مانند تشخیص شخص و شناسایی کلمات کلیدی، تصور کرد. این رویکرد امکان جمعسپاری دادهها را فراهم میکند و میتواند از تخصص جامعه استفاده کند و در عین حال اطمینان حاصل شود که مدل و دستگاه بهدستآمده در دسترس عموم است، و دسترسی کلی به منابع ML را گسترش میدهد.
با این حال، یک رویکرد واقعاً باز ممکن است کاربرد حسگرهای ML را تنها به کاربردهای فراگیر محدود کند، زیرا انگیزه اقتصادی کمی برای شرکتها برای ارائه راهحلهای خود وجود خواهد داشت. راه حل منبع بسته نیز ایده آل نیست زیرا دسترسی از طریق دیوار پرداخت را محدود می کند و راه حل ها به دلیل تخصص و دسترسی محدود به داده ها احتمالاً کمتر از حد مطلوب هستند.
شاید برجسته ترین رویکرد، رویکردی نیمه شفاف باشد. به این ترتیب، شرکتها میتوانند تضمینهایی را از طریق برگه داده حسگر ML خود ارائه کنند و اطلاعات کافی مانند مجموعه دادههای اعتبارسنجی را برای بررسی و اعتبارسنجی ادعاهای مدل بدون انتشار کل مالکیت معنوی حسگر ML، مانند معماری مدل و مجموعه دادههای آموزشی کامل، در اختیار کاربران قرار دهند. . این رویکرد تعادلی بین ایجاد انگیزه راهحلهای منبع باز برای همهجایترین برنامهها، ایجاد انگیزههای اقتصادی برای شرکتها برای ارائه راهحلهای خود و ارتقای اعتماد بین شرکتها و کاربران نهایی ایجاد میکند.
خلاصه
مانند هر رویکرد دیگری، این پارادایم بدون مشکل نیست. نگرانیهای سنتی ML مانند تعصب مدل، پتانسیل حملات خصمانه، و کاهش قابلیت تفسیر و توضیح عملکرد دستگاه ما همچنان باقی است. همچنین این امکان وجود دارد که حسگرهای ML برای اهداف مخرب مورد سوء استفاده قرار گیرند، مانند در داخل سلاح یا سرکوب آزادی بیان. همانطور که گفته شد، تأثیر خالص حاصل از افزایش قابلیت استفاده ML در برنامههای سختافزاری، امیدواریم تاثیر مثبتی باشد، بهویژه اگر ملاحظات اخلاقی مناسب توسط افراد هنگام طراحی و توسعه حسگرهای ML انجام شود.
همانطور که مهندسی برق از الکترومغناطیس و مهندسی شیمی از شیمی تکامل یافته است، حسگرهای ML یک پله طبیعی در سفر ML از حوزه تحقیقاتی به یک رشته مهندسی کامل (پیشآل) را نشان میدهند که از نزدیک با برق در هم آمیخته است. مهندسی. در حالی که مشخص نیست این زمینه چگونه به تکامل خود ادامه خواهد داد، من پیش بینی می کنم که به نوعی ایده حسگرهای ML را در خود جای دهد.
اولین دیدگاه را ثبت کنید