بخش‌بندی تصوير بر مبنای طبقه‌بندی

نویسنده:

محمد سلطان پور

تاریخ انتشار:

03 آبان 1402

دیدگاه ها:

در این مطلب قصد داریم تا بخش‌بندي تصوير بر مبناي طبقه‌بندي را جهت پردازش تصویر به شما معرفی کنیم، لطفا با ما همراه باشید.

مقدمه

طبقه‌بندي در واقع ارزشيابي ويژگي‌هاي مجموعه‌اي از داده‌ها و سپس اختصاص دادن آن‌ها به مجموعه‌اي از گروه‌هاي از پيش تعريف شده‌است. اين متداول‌ترين قابليت داده کاوي مي‌باشد. داده کاوي را مي‌توان با استفاده از داده‌هاي تاريخي براي توليد يک مدل يا نمايي از يک گروه براساس ويژگي‌هاي داده‌ها به کار برد. سپس مي‌توان از اين مدل تعريف شده براي طبقه‌بندي مجموعه داده‌هاي جديد استفاده کرد. همچنين مي‌توان با تعيين‌نمايي که با آن سازگار است براي پيش‌بيني‌هاي آتي از آن بهره گرفت.

طبقه‌بندی

در واقع سيستم‌هايي که براساس طبقه‌بندي داده کاوي مي‌کنند، دو مجموعه ورودي دارند: يک مجموعه آموزشي که در آن داده‌هايي که به طور پيش فرض در دسته‌هاي مختلفي قرار دارند، همراه با ساختار دسته‌بندي خود وارد سيستم مي‌شوند و سيستم براساس آنها به خود آموزش مي‌دهد يا به عبارتي پارامترهاي دسته‌بندي را براي خود مهيا مي‌کند. دسته ديگر از ورودي‌هايي هستند که پس از مرحله آموزش و براي تعيين دسته وارد سيستم مي‌شوند . تکنيک‌هاي داده کاوي که براي دسته‌بندي به کار مي‌آيند عموماً شامل تکنيک‌هاي شبکه عصبي و درخت تصميم‌گيري هستند. هدف طبقه‌بندي داده‌ها، سازماندهي و تخصيص داده‌ها به کلاس‌هاي مجزا مي‌باشد. در اين فرايند براساس داده‌هاي توزيع شده، مدل اوليه‌اي ايجاد مي‌گردد. سپس اين مدل براي طبقه‌بندي داده‌هاي جديد مورد استفاده قرار مي‌گيرد، به اين ترتيب با بکارگيري مدل بدست امده، تعلق داده‌هاي جديد به کلاس قابل پيشگويي مي‌باشد. طبقه‌بندي در مورد مقادير گسسته و پيشگويي آنها به کار مي‌رود.هدف پيشگويي، پيش بيني و دريافت مقدار يک خصيصه براساس خصيصه‌هاي ديگر مي‌باشد. براساس داده‌هاي توزيعي، در ابتدا يک مدل ايجاد مي‌گردد، سپس از اين مدل در پيشگويي مقادير ناشناخته استفاده مي‌شود. در داده کاوي، طبقه‌بندي، به پيشگويي مقادير گسسته و پيشگويي به تخمين مقادير پيوسته اتلاق مي‌شود. در فرايند طبقه‌بندي، اشيا موجود به کلاس‌هاي مجزا با مشخصه‌هاي تفکيک شده (ظروف جداگانه) طبقه‌بندي و به صورت يک مدل معرفي مي‌گردند. سپس با در نظر گرفتن ويژگي‌هاي هر طبقه، شي جديد به آنها تخصيص يافته، برچسب و نوع آن پيشگويي مي‌گردد.در طبقه‌بندي، مدل ايجاد شده بر پايه‌ي يکسري داده‌هاي آموزشي، (اشيا داده‌هايي که بر چسب کلاس آنها مشخص و شناخته شده‌است) حاصل مي‌آيد. مدل بدست آمده در اشکال گوناگون مانند قوانين طبقه بندي (If-Then)، درخت‌هاي تصميم، فرمول‌هاي رياضي و شبکه‌هاي عصبي قابل نمايش مي‌باشد. از طبقه‌بندي ميتوان براي پيشگويي کلاس اشيا داده‌ها استفاده کرد. در برخي موارد نيز افراد ترجيح مي‌دهند مقدار يک خصيصه و نه کلاس آن را پيشگويي نمايند که به يافتن مقدار يک خصيصه، پيشگويي اتلاق مي‌گردد. در هر حال پيشگويي، تخمين مقدار و بر چسب کلاس را با هم در بر مي‌گيرد. طبقه‌بندي و پيشگويي با استفاده از تحليل ارتباط، خصيصه‌هايي را که فرايند مورد نظر، بي تاثير و قابل حذف مي‌باشند، شناسايي مي‌کنند.

طبقه‌بندی داده‌ها يک فرآيند دو مرحله ای است: 1-يادگيري 2–طبقه‌بندي

1-در مرحله اول يک مدل ساخته مي‌شود که مجموعه‌اي از کلاس‌هاي داده‌اي يا مفاهيم را مشخص مي‌کند. اين مرحله را مرحله يادگيري گوييم که در ان يک الگوريتم طبقه‌بندي يک مدل را با تحليل يک مجموعه‌ي آموزشي که مجموعه‌اي از تاپل‌هاي پايگاه دادهاست مي‌سازد و بر چسب کلاس‌هاي مربوط به اين تاپل‌ها را مشخص مي‌کند. يک تاپل X با يک بردار صفت (x1،x2،…،xn)-X نمايش داده مي‌شود. فرض مي‌شود که هر تاپل به يک کلاس از پيش تعريف شده متعلق است و کلاس با يک صفت که به آن صفت بر چسب کلاس مي‌گوييم مشخص مي‌شود. مجموعه آموزشي به صورت تصادفي از پايگاه انتخاب مي‌شود. از آنجايي که برچسب هر تاپل آموزشي در اين مرحله مشخص است، اين مرحله يادگيري نظارت شده ناميده مي‌شود. 2- در مرحله دوم، از مدل ساخته‌شده براي طبقه‌بندي استفاده مي‌شود. يادگيري از طريق يک تابع (X)fy انجام مي‌شود که مي‌تواند برچسب کلاس هر تاپل X از پايگاه را پيش‌بيني کند. اين تابع به صورت قواعد طبقه‌بندي، درخت‌هاي تصميم‌گيري يا فرمول‌هاي رياضي است. شکل زیر نشان مي‌دهد که چگونه يک تابع طبقه‌بندي ساخته شده و سپس داده‌هاي جديد بوسيله آن طبقه‌بندي مي‌شوند.

در ابتدا ميزان دقت مدل يا کلاسه‌بند تخمين زده مي‌شود. اين تاپلها تصادفي انتخاب شده و مستقل از تاپل‌هاي مجموعه آموزشي هستند. ميزان دقت در پيشگويي يک مدل روي مجموعه تست داده‌شده برابر است با درصد تاپل‌هايي از تاپل‌هاي مجموعه تست که توسط مدل، درست طبقه‌بندي شده‌اند. برچسب کلاس هر تاپل مجموعه تست، با برچسب کلاس پيشگويي شده براي آن تاپل توسط مدل يادگيري مقايسه مي‌شود اگر ميزان دقت مدل قابل قبول واقع شود، انگاه اين مدل ميتواند براي طبقه‌بندي تاپل‌هاي جديد با بر چسب کلاس نامعلوم استفاده شود. (در اصطلاحات يادگيري ماشين به اين نوع تاپل‌ها يا داده‌ها unknown or previously unseen data گفته مي‌شود).

انواع روش‌های طبقه‌بندی

استنتاج بر اساس درخت تصميم
طبقه‌بندي بيز
شبکه‌هاي عصبی
نزديکترين همسايه‌ها
استنتاج مبتني بر مورد
الگوريتم‌هاي ژنتيک
مجموعه‌های فازی

ارزيابی روش‌های طبقه‌بندی

ارزيابي روش‌هاي طبقه‌بندي با معيارهاي زير انجام مي‌پذيرد:

ميزان دقت

Classifer accuracy: ميزان قابليت و توانايي يک مدل در پيشگويي صحيح بر چسب يک کلاس.

Predictor accuracy: ميزان قابليت و توانايي يک مدل در حدس مقدار صفت‌هاي پيشگويي شده.

سرعت و توسعه پذيري از نظر زماني که براي ايجاد يک مدل و زمان استفاده از آن مدل لازم مي‌باشد . اين زمان شامل مدت زمان ساخت مدل (زمان‌يادگيري) و مدت زمان استفاده از مدل (زمان طبقه بندي/پيشگويي) مي‌باشد.
قوي بودن معيار مهمي است که ميزان توانايي يک مدل را دربرخورد با نويز و مقادير حذف شده تعيين مي‌کند.
توسعه‌پذيري معيار ديگري است که از نقطه نظر ميزان کارايي در بانک‌هاي اطلاعات بزرگ و نه داده‌هاي مقيم در حافظه مورد بررسي قرار مي‌گيرد.
قابل تفسير بودن يعني ميزان و سطح درک ايجاد شده توسط مدل از ديگر مواردي است که مي‌بايست در بررسي روش‌هاي طبقه‌بندي در نظر گرفت.
ساير روش‎‌ها از جمله شکل قوانين و نحوه نمايش ان‌ها از جمله سايز درخت تصميم و فشردگي و پيوستگي.

بررسی انواع روش‌های طبقه‌بندی

درخت تصميم

درخت تصميم يکي از ابزارهاي متداول براي دسته‌بندي و پيش‌بيني است. توليد يک درخت تصميم روش کارآمدي براي ايجاد رده، بندها يا طبقه‌بندي کننده‌ها بر روي داده‌ها است. اين درخت با بکارگيري يک استراتژي بالا به پايين به ايجاد آزمون بر روي هر گره مي‌پردازد. با توجه به ساختار بالا به پايين درخت تصميم اولين آزمون در گره ريشه که بالاترين گره در درخت است اتفاق ميافتد به اين صورت که يک رکورد جديد که برچسب کلاس آن نامشخص است در گره ريشه وارد مي‌شود و در اين گره يک آزمون صورت مي‌گيرد تا معلوم شود که اين رکورد به کدام يک از گره‌هاي فرزند تعلق دارد. اين فرايند آنقدر ادامه پيدا مي‌کند تا رکورد جديد به گرهي برگ برسد. هر گرهي برگ در درخت تصميم معرف يک برچسب کلاس يا يک دسته‌ي مشخص مي‌باشد. بنابراين تمام رکوردهايي که به يک برگ از درخت مي‌رسند در يک دسته قرار مي‌گيرند. نمونه‌اي از درخت تصميم در شکل زیر مشاهده مي‌شود:

بيزين

الگوريتم‌هاي يادگيري بيزي به طور صريح بر روي احتمالات فرض‌هاي مختلف کار مي‌کنند. کلاسه‌بندهاي بيزي کلاسه‌بندهاي آماري هستند. آنها اعضاي کلاس را به صورت احتمالي پيشگويي مي‌کنند. مثلاً ميزان احتمال اينکه يک نمونه داده شده متعلق به يک کلاس خاص باشد. طبقه‌بندي بيزي بر مبناي تئوري بيز مي‌باشد. مقايسه الگوريتم‌هاي طبقه‌بندي نشان داده‌ است که يک کلاسه‌بند بيزي ساده از نظر کارايي با کلاسه بندهاي درخت تصميم و شبکه‌هاي عصبي قابل رقابت است و در برخي موارد بهتر از انها عمل مي‌کند. همچنین کلاسه‌بندهاي بيزي ميزان دقت و سرعت بالايي را هنگامي که در ديتابيس‌هاي بزرگ به کار برده مي‌شوند، ارائه مي‌دهند. Naïve Bayesian classifier فرض ميکند که تاثير يک مقدار صفت روي يک کلاس داده‌شده، مستقل از مقادير ديگر صفت‌ها مي‌باشد. به اين فرض استقلال شرطي کلاس گفته‌مي‌شود. اين فرض محاسبات را ساده‌تر مي‌کند و به همين دليل است که به اين روش naïve گفته مي‎‌شود. Bayesian belief network ها نيز که براي طبقه‌بندي استفاده مي‌شوند، مدل‌هاي گرافيکي هستند که بر خلاف naïve Baysian classifier ها وابستگي ميان زير مجموعه‌اي از صفت‌ها را نمايش مي‌دهند.

روش طبقه‌بندي نزديکترين K- همسايه

هنگام تلاش براي حل مسائل جديد، افراد معمولاً به راه‌حل‌هاي مسائل مشابه که قبلاً حل شده‌اند مراجعه مي‌کنند. k- نزديکترين همسايه (k-NN) يک تکنيک طبقه‌بندي است که از نسخه‌اي از اين متد استفاده مي‌کند. در اين روش تصميم‌گيري اينکه يک نمونه جديد در کدام کلاس قرار گيرد با بررسي تعدادي (k) از شبيه‌ترين نمونه‌ها يا همسايه‌ها انجام مي‌شود. در بين اين k نمونه، تعداد نمونه ها براي هر کلاس شمرده مي‌شوند، و نمونه جديد به کلاسي که تعداد بيشتري از همسايه‌ها به آن تعلق دارند نسبت داده مي‌شود. شکل زیر محدوده همسايگي نمونه N را نشان مي‌دهد. در اين محدوده، بيش‌تر همسايه‌ها در کلاس X قرار گرفته‌اند.

اولين کار براي استفاده از k-NN يافتن معياري براي شباهت يا فاصله بين صفات در داده‌ها و محاسبه آن است. در حالي که اين عمل براي داده‌هاي عددي آسان است، متغيرهاي دست‌هاي نياز به برخورد خاصي دارند. هنگامي که فاصله بين نمونه‌هاي مختلف را توانستيم اندازه گيريم، مي‌توانيم مجموعه نمونه‌هايي که قبلاً طبقه‌بندي شده‌اند را به عنوان پايه دسته‌بندي نمونه‌هاي جديد استفاده کنيم. فهم مدلهاي K-NN هنگامي که تعداد متغيرهاي پيشبيني کننده کم است بسيار ساده است. آنها همچنين براي ساخت مدل‌هايي مانند متن که شامل انواع داده غير استاندارد هستند، بسيار مفيدند. تنها نياز براي انواع داده جديد وجود يک معيار مناسب شباهت است.

روش طبقه‌بندی شبکه‌های عصبی

شبکه عصبي بوسيله الگوريتم پس انتشار خطا آموزش داده مي‌شود. اين شبکه از يک لايه ورودي، يک لايه خروجي و يک يا چند لايه نهان تشکيل شده است. هر گره در لايه ورودي معادل يکي از صفت‌هاي نمونه ورودي مي‌باشد و گره‌هاي لايه خروجي نشان دهنده کلاس‌ها هستند. هر‌يال بين گره‌هاي اين لايه‌ها داراي يک وزن مي‌باشد که با يک مقدار تصادفي مقداردهي اوليه مي‌شود (به عنوان مثال رنجي بين 1.0- تا 1.0 يا 0.5- تا 0.5). در طول مرحله يادگيري، شبکه با تنظيم اين وزن‌ها با استفاده از يک تابع آموزش و نمونه داده‌هاي آموزشي، عمل يادگيري را انجام مي‌دهد. الگوريتم طبقه‌بندي شبکه عصبي پرسپترون چند لايه (MLP)، اساس شبکه‌هاي عصبي جلو برنده مي‌باشد. نمونه‌اي از اين شبکه دو لايهاي در شکل زیر مشاهده مي‌شود. جلو برنده، به اين معني است که مقدار پارامتر خروجي براساس پارامترهاي ورودي و يک سري وزن‌هاي اوليه تعيين مي‌گردد. مقادير ورودي با هم ترکيب شده و در لايه‌هاي نهان استفاده مي‌شوند و مقادير اين لايه‌هاي نهان نيز براي محاسبه مقادير خروجي ترکيب مي‌شوند.

روش طبقه‌بندی ماشين بردار پشتيبان

ماشين بردار پشتيبان (SVM) يکي از روش‌هاي يادگيري ماشين است که از تئوري يادگيري آماري سرچشمه مي‌گيرد و از آن براي طبقه‌بندي و رگرسيون استفاده مي‌کنند. اين روش از جمله روش‌هاي نسبتاً جديدي است که در سال‌هاي اخير کارايي خوبي براي طبقه‌بندي نسبت به روش‌هاي قديمي‌تر از جمله شبکه‌هاي عصبي پرسپترون نشان داده است. مبناي کاري طبقه بندي SVM، طبقه بندي خطي داده‌ها است. در تقسيم خطي داده‌ها سعي مي‌شود خطي انتخاب شود که حاشيه اطمينان بيشتري داشته باشد. براي يک مسئله طبقه بندي دو کلاسه، هدف جداسازي دو کلاس بوسيله يک تابع است که از نمونه‌هاي آموزشي بدست مي‌آيد. شکل زیر يک مثال از يک مجموعه داده‌ي دو بعدي (دو کلاسه) را نشان مي‌دهد که کلاس‌هاي سياه رنگ و سفيد رنگ توسط خط x 2=6.5 – 2x 1 از هم جدا شده‌اند. رنگ تيره در اطراف اين خط، ماکزيمم حاشيه‌ان خط را نشان مي‌دهد.

شرکت نوین ایلیا صنعت از جمله شرکت‌هایی است که با دارا بودن نمایندگی رسمی برندهای فوق‌العاده معتبری چون باسلر و سنسوپارت، نقش مهمی در زمینه طراحی و تولید سنسور پردازش تصویر و بهینه‌سازی فناوری‌های مربوط به آن در ایران ایفا می‌کند. این شرکت با واردات قطعات و تجهیزات مطمئن و اورجینال به کشور، خدمات خود را به طرزی شایسته و با ضمانت معتبر به مشتریان خود ارائه می‌نماید. در حال حاضر شرکت نوین ایلیا صنعت در زمینه واردات فناوری پردازش تصویر، طراحی، پیاده‌سازی، نصب و راه اندازی سنسورها و ابزارها و دستگاه‌های لازم در این خصوص، به صورتی بی رقیب، پیشتاز میدان می‌باشد. در صورت نیاز به مشاوره در مورد این فناوری و یا هرگونه سوال درباره سنسور پردازش تصویر، ماشین‌های بینایی، دوربین‌های صنعتی و هوشمند کافی است با ما تماس بگیرید.

مطالب مرتبط

دوربین ترافیکی سیستم‌های نظارت ترافیک (Traffic Enforcement Cameras) تشخیص پلاک خودرو (ANPR / ALPR) سنسور CMOS سنسور CCD Global Shutter Rolling Shutter سنسور BSI فناوری مادون قرمز NIR کنترل سرعت و تخلفات ترافیکی

معرفی دوربین‌های حوزه ترافیک و بررسی تفاوت سنسورها در قیمت

25 خرداد 1405

Basler دوربین صنعتی بینایی ماشین (Machine Vision) آزمایشگاه بینایی ماشین pylon Camera Software Suite Basler ace 2 Basler boost Basler dart Basler racer GigE Vision Grab Engine Low Latency Multi-Camera Synchronization Precision Time Protocol (PTP) Sequencer Pixel Beyond Compression Beyond پردازش تصویر (Image Processing) یادگیری عمیق (Deep Learning) کنترل کیفیت صنعتی

دوربین‌های Basler؛ ابزار کلیدی در آزمایشگاه‌های بینایی ماشین پیشرفته

24 خرداد 1405

هوش مصنوعی دوربین‌های ترافیکی تحلیل کلان‌داده شهرهای هوشمند بینایی رایانه‌ای پردازش لبه‌ای چراغ‌های راهنمایی تطبیقی خودروهای متصل (V2X) حریم خصوصی امنیت سایبری

آینده دوربین‌های ترافیکی: هوش مصنوعی، تحلیل کلان‌داده و شهرهای هوشمند

14 خرداد 1405

دوربین باسلر آزمایشگاه بینایی ماشین دوربین صنعتی Basler ace 2 دوربین Line Scan دوربین سه‌بعدی blaze بینایی ماشین دانشگاهی pylon SDK Embedded Vision GigE Vision

تنوع دوربین‌های باسلر برای راه‌اندازی یک آزمایشگاه بینایی ماشین در دانشگاه

12 خرداد 1405

پلاک‌خوانی (ANPR/LPR) پردازش تصویر اولیه (ISP) شارپ‌سازی مصنوعی (Edge Enhancement) Unsharp Mask هاله (Halo) OCR (تشخیص کاراکتر) کاهش نویز (Noise Reduction) WDR / HDR Tone Mapping فشرده‌سازی ویدئو (H.264/H.265) تصویر خام (RAW)

چرا پردازش تصویر اولیه نامناسب در دوربین‌های متفرقه باعث «شارپ‌شدن مصنوعی» و افت دقت پلاک‌خوانی می‌شود؟

10 خرداد 1405

Basler ace 2 (برند و خانواده محصول) بینایی ماشین (Machine Vision - حوزه اصلی کاربرد) هزینه کل مالکیت (TCO - کلیدی‌ترین مفهوم اقتصادی متن) دوربین صنعتی (Industrial Camera - دسته تجهیزات) سنسور CMOS (قلب تپنده و عامل اصلی کیفیت تصویر) شاتر سراسری (Global Shutter - نیاز حیاتی برای پروژه‌های حرکتی) یکپارچه‌سازی (Integration - فاکتور اصلی در سرعت توسعه پروژه) pylon SDK (اکوسیستم نرم‌افزاری و ابزار کلیدی برای برنامه‌نویسان) بهینه‌سازی تصویر (Image Optimization/PGI - عامل کاهش بار پردازشی میزبان) رابط کاربری صنعتی (مانند GigE, USB 3.0, GMSL2 - عامل انعطاف در طراحی سیستم)

استفاده از سری Basler ace 2 برای پروژه‌های با نیاز کیفیت بالا و بودجه اقتصادی

2 خرداد 1405