یک چارچوب جدید آشکارسازی و تشخیص لوگو در تصاویر متنی

نوع مقاله: مقاله پژوهشی

نویسندگان

1 استادیار/دانشگاه آزاد اسلامی واحد نجف آباد

2 دانشجوی دکترا/دانشگاه علوم پزشکی تهران

چکیده

آشکارسازی و تشخیص لوگو یک بخش اساسی در یک سیستم خودکارسازی اداری جهت بایگانی و بازیابی تصاویر متنی می‌باشد. در این مقاله، ما یک چارچوب جدید آشکارسازی و تشخیص لوگو مبتنی بر یک استراتژی ناحیه‌بندی و طبقه‌بندی پشت سر هم در تصاویر متنی پیشنهاد می‌کنیم. در این چارچوب، با استفاده از یک الگوریتم ناحیه‌بندی دو مرحله‌ای (شامل الگوریتمهای ناحیه‌بندی مبتنی بر تبدیل ویولت و آستانه‌گذاری) و طبقه‌بندی سلسله مراتبی به وسیله دو طبقه‌بند شبکه عصبی پرسپترون چندلایه و یک طبقه بند نزدیکترین همسایگی، یک تصویر متنی به نواحی کاندیدای لوگو، عکسی خالص و متنی تقسیم بندی می‌گردد. سرانجام نیز در تصمیم‌گیری نهایی، کلاس لوگو کاندیدا بر اساس یک مجموعه از کلاسهای از پیش تعریف‌شده‌ای تعیین می‌گردد. در مرحله طبقه‌بندی و تشخیص سلسله مراتبی لوگو، بهترین مجموعه از ویژگیهای شکل و بافت به وسیله الگوریتم انتخاب ویژگی رو به جلو انتخاب می‌گردد. چارچوب پیشنهادی براساس یک پایگاه داده بزرگ و متنوع از تصاویر متنی و غیرمتنی و همچنین لوگوهای ایرانی و بین‌المللی مورد ارزیابی قرار گرفت. نتایج حاصل کارایی و کارآمدی چارچوب پیشنهادی را در شرایط محیط پیاده‌سازی واقعی و عملی نشان می‌دهد.

کلیدواژه‌ها


عنوان مقاله [English]

A Novel Framework for Logo Detection and Recognition from Document Images

نویسندگان [English]

  • Hossein Pourghasem 1
  • Amir Salar Jafarpisheh 2
1 Assistant Professor/Islamic Azad University, Najafabad Branch
2 Ph.D Candidate /Tehran University of Medical Sciences
چکیده [English]

Logo detection and recognition module is a vital requirement in official automation systems for document image archiving and retrieval applications. In this paper, we present a novel framework for logo detection and recognition based on sequential segmentation and classification strategy of document image. In this framework, using a two-stage segmentation algorithm (consisting of wavelet-based and threshold-based segmentation algorithms) and hierarchical classification by two multilayer Perceptron (MLP) classifiers and a k-nearest neighbor (KNN) classifier, a document image divides to text, pure picture and logo candidate regions. Ultimsately, in final decision, class of logo candidate region is determined based on pre-defined classes. In the hierarchical classification and logo recognition stages, the best feature space is selected by forward selection algorithm from a perfect set of texture and shape features. The proposed structure is evaluated on a variety and vast database consisting of the document and non-document images with Persian and international logos. The obtained results show efficiency of the proposed framework in the real and operational conditions.

کلیدواژه‌ها [English]

  • Logo detection and recognition
  • document image
  • two-stage segmentation
  • hierarchical classification