مقدمه

تشخیص پلاک خودرو یکی از مهم‌ترین کاربردهای بینایی ماشین و پردازش تصویر است. در ایران، استفاده از پلاک‌های فارسی با اعداد و حروف خاص، نیازمند دیتاست‌هایی بومی و اختصاصی است. تا پیش از این، کمبود دیتاست‌های معتبر فارسی باعث می‌شد پروژه‌های تشخیص پلاک با محدودیت مواجه شوند. اما اکنون با معرفی Iranis Dataset این مشکل تا حد زیادی برطرف شده است.

 

معرفی دیتاست Iranis

دیتاست Iranis یک مجموعه بزرگ و تخصصی شامل بیش از ۸۳ هزار تصویر از اعداد و حروف فارسی روی پلاک خودروها است. رفقا، این دیتاست فوق‌العاده برای آموزش مدل‌های هوش مصنوعی در زمینه تشخیص کاراکترهای پلاک فارسی طراحی شده و می‌تواند تحول بزرگی در پروژه‌های بینایی ماشین ایجاد کند 🚗✨.

🔗 لینک دانلود دیتاست: Iranis Dataset

ویژگی‌های دیتاست Iranis

  • شامل تصاویر واقعی از پلاک خودروهای فارسی
  • بیش از ۸۳,۰۰۰ نمونه تصویری از اعداد، حروف و نمادهای خاص
  • دسته‌بندی دقیق بر اساس:
    • اعداد (۰ تا ۹)
    • حروف فارسی مانند الف، ب، پ، ج، ه و…
    • نمادهای خاص مانند ویلچر برای افراد دارای معلولیت ♿ و حروف مخصوص تاکسی یا خودروهای عمومی

مشخصات فنی دیتاست

این دیتاست از تصاویر پلاک‌های واقعی گرفته‌شده با دوربین‌های مختلف جمع‌آوری شده و شامل ۸۳,۸۴۴ نمونه است. هر کلاس (کاراکتر) دارای هزاران نمونه است که برای آموزش مدل‌های یادگیری ماشین بسیار مناسب است.

نمونه دسته‌بندی کاراکترها

  • اعداد:
    • عدد ۰ → ۲۵۰۱ نمونه
    • عدد ۴ → ۵۷۷۴ نمونه
    • عدد ۶ → ۵۷۵۳ نمونه
  • حروف:
    • الف → ۲۵۱۷ نمونه
    • ب → ۲۵۱۱ نمونه
    • ن → ۲۵۵۸ نمونه
    • ی → ۲۴۹۱ نمونه
  • نمادها:
    • تاکسی (ت) → ۲۵۵۱ نمونه
    • خودرو عمومی (ع) → ۲۵۰۸ نمونه
    • افراد دارای معلولیت (🦽) → ۲۵۰۲ نمونه

کاربردهای دیتاست Iranis

این مجموعه می‌تواند در پروژه‌های مختلف مورد استفاده قرار گیرد، از جمله:

  • تشخیص کاراکترهای پلاک خودرو به‌صورت خودکار
  • آموزش مدل‌های بینایی ماشین برای شناسایی متون فارسی
  • توسعه سیستم‌های هوشمند کنترل ترافیک
  • استفاده در دوربین‌های شهری و جاده‌ای برای پایش خودروها
  • ایجاد سیستم‌های امنیتی و نظارتی در پارکینگ‌ها یا مکان‌های عمومی

مزیت Iranis نسبت به سایر منابع

  • حجم بالا: بیش از ۸۳ هزار نمونه که پوشش کاملی از حروف و اعداد دارد.
  • کیفیت بالا: جمع‌آوری از تصاویر واقعی و نه داده‌های مصنوعی.
  • تنوع: شامل اعداد، حروف و نمادهای ویژه که در پلاک‌های ایرانی به‌کار می‌روند.
  • دسترس‌پذیری: علاوه بر GitHub، روی پلتفرم‌هایی مثل Kaggle و Data.world نیز در دسترس است.

جمع بندی

Iranis Dataset یک منبع ارزشمند برای توسعه سیستم‌های هوشمند تشخیص پلاک خودرو در ایران است. با داشتن بیش از ۸۳ هزار نمونه تصویری از اعداد، حروف و نمادهای خاص، این دیتاست می‌تواند پروژه‌های مبتنی بر هوش مصنوعی و بینایی ماشین را به سطح بالاتری برساند. اگر قصد دارید در زمینه تشخیص پلاک فارسی فعالیت کنید، Iranis بهترین نقطه شروع برای شماست.