دانلود مقاله بهبود شناسایی آرم در سند های تصویری مبتنی بر الگوریتم ژنتیک

Word - pdf 2 MB 34595 9
مشخص نشده مشخص نشده کامپیوتر - IT
قیمت قدیم:۱۲,۰۰۰ تومان
قیمت: ۷,۶۰۰ تومان
دانلود فایل
  • بخشی از محتوا
  • وضعیت فهرست و منابع
  • چکیده -تشخیص آرم یکی از راه های تشخیص منابع اسنادو اطلاعاتی درباره یک سند می باشد.در این مقاله شناسایی و تشخیص آرم ها در تصاویر متنی بیان می شود.بدین صورت که ابتدا تصاویر به سگمنت هایی تقسیم شده ، توسط فاز تشخیص آرم، برای هر سگمنت ویژگی هایی بر پایه آمار اولیه در مورد مؤلفه های پیکسل های سیاه درون هر بخش محاسبه می شود.با استفاده از این ویژگی ها، شبکه عصبی تکاملی بر پایه الگوریتم ژنتیک، سگمنت ها را بر اساس احتمال وجود آرم یا عدم وجود آن دسته بندی می نماید.در نهایت  در مجموعه انتخابی به عنوان مجموعه آرم ها، فاز انطباق آرم به کمک ویژگی های هندسی  محلی  و مستقل  انجام می شود. نتایج نشان می دهد که استفاده از شبکه عصبی تکاملی به منظور شناسایی آرم، با ارائه نتایج مطلوب به عنوان دستاوردی جدید در کنار دیگر روش ها قابل استفاده می باشد.

     

    کلمات کلیدی   -استخراج ویژگی ، الگوریتم ژنتیک، تابع ارزیاب، شبکه عصبی تکاملی

     

     

    1- مقدمه

      مسئله تشخیص آرم از گرایش های بزرگ در حوزه سند خصوصا برای پایگاه داده ها می باشدو مزیت آن امکان بالقوه اش برای تشخیص منابع اسنادوکلی گویی اش برای مسئله تشخیص واطلاعات معنایی در مورد متن است.در زمینه کاربرد سندهای تصویری، تشخیص آرم های مشابه با دو شیوه قابل انجام است .اول- سندی که شامل یک آرم باشد را به عنوان ورودی وارد نموده و سیستم ، آرم را به عنوان یکی از اعضای مجموعه کوچک آرم های شناخته شده  یا به عنوان آرمی که در حال حاضر در پایگاه داده موجود نیست ، طبقه بندی می کند.دوم -آرم خاصی را (شناخته شده یا شناخته نشده) در پایگاه داده ای از اسناد اندیس گذاری نموده و اسنادی که شامل آن آرم باشند را استخراج می نماید. نمونه ای از یک سندتصویری در شکل1 نشان داده شده است.مسئله شناسایی آرم را می توان در سه مرحله تقسیم بندی نمود]2,1[:

    1- بخش بندی1 : تصویر سند به تصاویرکوچکتری که شامل ارتباطات منطقی بخش هایی از سند می باشد، تقسیم می شود.

    2- تشخیص آرم2 : ویژگی هایی از بخش ها استخراج می شوند سپس در دسته بندی بخش ها، بر پایه اینکه احتمالا شامل آرم هستند یا خیر،استفاده می شوند.

    3-انطباق آرم3:مجموعه منتخب آرم هادر فاز2 با پایگاه داده شامل کلیه آرم هاانطباق پیدا می کنند تا آرم دقیقا شناسایی و تعیین شود. در اکثر کاربردها هدف نهایی فاز سوم می باشد]5-2[.

     

     

     

    1Segmentation

    2Logo Detection

    3Logo Matching

     

     

    شکل1- نمونه ای از سند تصویری

                                              

    از آنجا که انطباق آرم(فاز سوم) روند محاسباتی گسترده ای خواهد داشت فاز تشخیص آرم بخش های شامل آرم را هرس می کند]7,6,1[.

    تشخیص آرم به عنوان یکی از کاربردها در حوزه شناسائی الگو،در سال های اخیر مورد بحث و بررسی واقع شده است.بسیاری از نظریه های مطرح شده براساس نگرش های نحوی و روش های آماری می باشد.در نگرش نحوی با دانش نوع متن،به وسیله موقعیت آرم در صفحه ،آرم منتخب قابل شناسایی است]2.[

    ازمهمترین روش های آماری می توان به مواردذیل اشاره نمود: استخراج شانزده ویژگی آماری هر بخش واشتقاق مجموعه ای از قوانین بااستفادهازالگوریتم]ID38[ استفاده ازشبکه های عصبی بازگشتی rnns)) با انتقال دقیق آرم با نمایش درختm تایی ]6[،به کارگیری Edgebackpropagationدرتصاویر شامل نویز ]9 [و نیز تشخیص آرم تحت تبدیل هایی مانند انتقال ،تغییر مقیاس و چرخش ]2 [ .

     فاز انطباق آرم از ثابت های هندسی به عنوان ویژگی های پیچیده تر استفاده می کند. مقاله حاضر با تمرکز برفاز دوم ،با به کارگیری شبکه عصبی تکاملی نتایج قابل قبولی ارائه می دهد.

    در ادامه فاز تشخیص آرم  شرح داده خواهد شد به طوریکه به منظور حفظ استقلال روش پیشنهادی از فرضیاتی در مورد چیدمان متن استفاده نمی کنیم که این از مزایای روش به شمار می رود.

     

    2- روش پیشنهادی

     

    شناسایی دقیق یک آرم شامل سه مرحله کلی بخش بندی تصویر ،تشخیص آرم و انطباق آرم می باشد.بخش بندی تصویر با استفاده از الگوریتمtop-down سلسله مراتبی ]2[ ، مسئله انطباق آرم نیز در

    ]1 [تشریح شده است. این مقاله بر مسئله تشخیص آرم تاکید داشته که با در اختیار گرفتن مجموعه ای از بخش ها به عنوان ورودی (تصاویر متنی بخش بندی شده در فاز اول )،پس از استخراج ویژگی ،با استفاده از شبکه عصبی تکاملی،بر پایه الگوریتم ژنتیک ،آن هارا به دو مجموعه قطعه های شامل آرم و قطعه های بدون آرم افراز می نماید] 11,10[.

     

    2-1- استخراج ویژگی

    ابتداسند هااسکن ویک تصویر باینری برای هر سند تولید می شود. سپس بر روی هر یک،روال بخش بندی اجرا می شودکه نتیجه آن مجموعه ای از تصاویربخش هاست. الگوریتم بخش بندی مورد استفاده یک الگوریتم بالا به پائین سلسله مراتبی با شمای بخش بندی درختی  X-Yمی باشد ]2[.هربخش پس از نرمال شدن، در مجموعه بزرگی از بخش هاقرار داده می شود.

    از هر بخش ویژگی هایی آماری مرتبط با پیکسل های سیاه رنگ مشتق شده استخراج می شود .بیشترین بخش محاسباتی این فرآیند محاسبه مؤلفه های متصل به هم است ، که بدین منظور از توابع Morphology  در نرم افزار Matlab استفاده شده است.با شناسایی مولفه های متصل به هم استخراج ویژگی به آسانی قابل انجام است،این ویژگی ها در عین سادگی،به طور چشمگیری در تمایز قائل شدن بین آرم ها و غیر آرم ها مؤثر می باشد. در شکل 1 مجموعه ویژگی های بکار رفته لیست شده اند .

    2-2- شبکه های عصبی

     

    شبکه های عصبی ساختارهایی مناسب در جهت شناسایی ودسته بندی الگوها می باشند.با این وجود دارای محدودیت هایی نیز هستند ،مسئله آموزش یکی از بزرگترین

    محدودیت ها در این شبکه هاست. الگوریتمی که برای این منظور به کار برده می شود نمی تواند لزوما یک جواب بهینه را متضمن شود.

    درکاربردهای واقعی الگوریتم  پس انتشار4 خطاممکن است که به مجموعه ای از وزن ها همگرایی پیدا کند که بهینه نمی باشند (کمتر از حد بهینه هستند) و همچنین نمی توانند از این مجموعه جواب ها بگریزند.GA ،تکنیک مؤثری به منظور بهینه سازی است،در مقاله حاضر از این الگوریتم در بهینه سازی وزن های شبکه استفاده شده است ، معماری شبکه(تعداد نرون ها و ارتباطات) نیز به روش سعی و خطا انتخاب شده است.

     

       لیست ویژگی های استفاده شده

     

    1- تعداد مؤلفه ها

    2- میانگین ناحیه مؤلفه

    3- میانگین طول مؤلفه

    4-انحراف معیارطول مؤلفه

    5- میانگین عرض مؤلفه

    6- ماکسیمم ناحیه مؤلفه

    7- ماکسیمم طول مؤلفه

    8- ماکسیمم عرض مؤلفه

    9- طول بخش

    10- عرض  بخش

    11- چگالی بخش

    12- ماکسیمم طول       وابسته با طول بخش

    13- ماکسیمم عرض وابسته با عرض بخش

    14-نسبت شیب محدوده

     هر بخش

    15-انحراف معیار چگالی افقی

    16-انحراف معیار چگالی عمودی

     

    2-3- بهینه سازی وزنی تکاملی

    گام اول در بهینه سازی کد کردن مسئله در قالب کروموزوم می باشد.در روش پیشنهادی از وزن های ارتباطی شبکه به عنوان ژن های کروموزوم استفاده می شود.

      مثالی از شبکه عصبی

     

     وزن های اولیه شبکه به صورت تصادفی در فاصله]1,1-[انتخاب می شوند.مجموعه ای از وزن ها در قالب یک ماتریس مربعی قابل نمایش است ،در این ماتریس هر عدد مربوط به وزن لینک بین دو نرون می باشد.عدد صفر بیانگر عدم ارتباط است .ساختار هر کروموزوم مجموعه ای از ژن هاست که هر ژن به صورت وزن (ارتباط بین 2 نرون)قابل تعریف است. به عنوان مثال شبکه ترسیمی در شکل 2 دارای 8 ارتباط می باشد که متناظر با آن در ماتریس 8 مقدار غیر صفر وجود داشته که به ترتیب ستونی در کروموزوم جایگذاری می شود.

  • فهرست:

    ندارد.
     

    منبع:

     

     

     [1] S. Seiden, M. Dillencourt, S. Irani, R. Borry, T. Murphy, “Logo detection in document images”.

    [2] D. S. Doermann, E. Rivlin, I. Weiss, “Logo recognition using geometric invariants,” Proceedings of  the second  International Conference on Document Analysis and Recognition,1993.p.894-7.

    [3] A. Lawrence Spitz, “Logotype Detection in Compressed  Images using Alignment Signatures,” Daimler Benz  Research and Technology Center, 1510  Page Mil Road, Palo Alto, California 94304 USA.

     [4] M. Gori, M. Maggini, S. Marinai, J. Q. Sheng, G. Soda,  “Edge-backpropagation for noisy logo recognition,” Dipartimento di Ingegneria dell'Information, Universita di Siena, Italy, Feb 2002.

     [5]  J. Neumann, H.  Samet, A.  Soer, “Integration of local and global shape analysis for logo classification,” Pattern Recognition Letters, 23 pp. 1449-1457, 2003.

     [6] D. Pham, Jinsong. Yang, “Logo Detection in Document Images with Complex Backgrounds.”  Griffith University QLD 4111, Australia.

    [7] J. Zhou, D. P. Lopresti, p. Sarkar, “Identification of Logos from Document Images,”  Matsushita Electric Industrial o., Ltd., Osaka(JP). Aug.14, 1998.

    [8] J. R. Quinlin, M. Kaufmann, “C4.5: Programs for Machine Learning,” San Mateo, California, 1992.

      [9] A. W. M. Smeulders, M. Worring, S.  Santini, A.  Gupta, R. Jain,  “Content-based image retrieval at the end of the early years,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 22(12) pp. 1349-1380, 2000.

    [10] CH. Huang ,  L. Chen,  Y.  Chen , M. Chang, “Evaluating the process of a genetic algorithm to improve the  back-propagation network: A Monte Carlo study,”  Expert Systems with Applications xxx (2008) xxx–xxx

    [11] Evolutionary Neural Network : The University of Melbourne: Assoc. Proffesor  Baikunth  Nath

     [12] D. S. Doermann, Document Processing Group Log Database, University of Maryland,  URL

    http://documents.cfar.umd.edu/resources/database/UMDlogo.html

     

رسوبات انتقالی توسط رودخانه‌ها مشکلات زیادی خصوصاً جهت بهره‌برداری از سدها و سازه‌های آبی به وجود می‌آورند. در ده‌های اخیر تحقیقات بزرگی برای درک مکانیسم انتقال رسوب در جریان‌های طبیعی صورت گرفته است. تخلیه‌های صنعتی و پساب‌های کشاورزی به داخل سیستم آبزیان باعث می‌شود که رسوبات کف توسط موادسمی آلوده شوند. به همین ترتیب وقتی رژیم رودخانه تغییر می‌نماید این رسوبات آلوده به پایین ...

چکیده: در عصر حاضر در بسیاری از موارد ماشین ها جایگزین انسانها شده اند و بسیاری از کارهای فیزیکی که در گذشته توسط انسانها انجام می گرفت امروزه توسط ماشین ها صورت می گیرد . اگرچه قدرت کامپیوترها در ذخیره، بازیابی اطلاعات و اتوماسیون اداری ،.. غیر قابل انکار است، اما همچنان مواردی وجود دارد که انسان ناچار است خودش کارها را انجام دهد. اما به طور کلی ، موارد مرتبط با ماشین شامل ...

در این تمرین روش های استخراج ویژگی و روش های خطی و غیر خطی دسته بندی را مورد مطالعه قرار می‌دهیم. در ابتدا روش های مختلف استخراج ویژگی که از آن جمله PCA، LDA، روش قاب بندی و چند روش دیگر هستند را و سپس برای ویژگی های استخراج شده از روش های دسته بندی خطی بیزین و SVM خطی و سپس روش های غیر‌خطی RBF ، MLP و همچنین SVM غیر‌خطی برای دسته بندی استفاده شده‌ است. بسته به روش شناسایی بکار ...

هوش محاسباتی یا (Computational-Intelligence) CI به معنای استخراج هوش، دانش، الگوریتم یا نگاشت از دل محاسبات عددی براساس ارائه به روز داده‌های عددی است. سیستم‌هایCI در اصل سیستم‌های دینامیکی مدل آزاد (Model-free) را برای تقریب توابع و نگاشتها ارائه می‌کند. در کنار این ویژگی بسیار مهم باید از ویژگی مهم دیگری در ارتباط با خصوصیات محاسباتی سیستم‌های CI نام برد، که در آن دقت، ...

بیماران قلبی بعضی مواقع دچار حملات ناگهانی می شوند که این وضعیت باعث به وجود آمدن صدماتی در بیمار و یا باعث مرگ وی خواهد شد.حال با بررسی سیگنال ECG که شامل اطلاعات بسیار مهمی از وضعیت قلب است می توان، بسیاری از بیماری های قلبی را تشخیص داد. بنابراین پیش بینی این سیگنال ها حتی برای چند ثانیه برای پزشک معالج مفید خواهد بود. چون این سیگنال ها به صورت غیر خطی بوده و شبکه های عصبی ...

مقدمه در سالیان اخیر شاهد حرکتی مستمر از تحقیقات صرفاً تئوری به تحقیقات کاربردی در پردازش اطلاعات برای مسائلی که راه حلی برای آنها موجود نیست بوده ایم. با توجه به این حقیقت توجه زیادی به توسعه تئوریک سیستمهای دینامیکی هوشمند مدل- آزاد بر اساس داده های تجربی وجود دارد. شبکه های عصبی مصنوعی جزء آن دسته از سیستم های دینامیکی قرار دارند که با پردازش بر روی داده های تجربی دانش در ...

مفید بودن شبکه عصبی آنالوگ مصنوعی بصورت خیلی نزدیکی با میزان قابلیت آموزش پذیری آن محدود می شود . این مقاله یک معماری شبکه عصبی آنالوگ جدید را معرفی می کند که وزنهای بکار برده شده در آن توسط الگوریتم ژنتیک تعیین می شوند . اولین پیاده سازی VLSI ارائه شده در این مقاله روی سیلیکونی با مساحت کمتر از 1mm که شامل 4046 سیناپس و 200 گیگا اتصال در ثانیه است اجرا شده است . از آنجائیکه ...

مقدمه شبکه های عصبی چند لایه پیش خور1 به طور وسیعی د ر زمینه های متنوعی از قبیل طبقه بندی الگوها، پردازش تصاویر، تقریب توابع و ... مورد استفاده قرار گرفته است. الگوریتم یادگیری پس انتشار خطا2، یکی از رایج ترین الگوریتم ها جهت آموزش شبکه های عصبی چند لایه پیش خور می باشد. این الگوریتم، تقریبی از الگوریتم بیشترین تنزل3 می باشد و در چارچوب یادگیری عملکردی 4 قرار می گیرد. عمومیت ...

چکیده: شبکه‌های عصبی مصنوعی از مباحث جدیدی است که دانشمندان علوم کامپیوتر به آن علاقمند شده‌اند و برای پیشرفت هرچه بیشتر علوم کامپیوتر وقت و هزینه بسیاری را صرف آن کرده و می‌کنند. این موضوع با ایده گرفتن از سیستم عصبی بدن انسان و با هدف شبیه‌سازی هرچه بیشتر کامپیوتر به انسان شکل گرفت و تا حال به خوبی پیشرفته است. از جمله کاربردهای این بحث می‌توان از شناسایی الگوها, پردازش تصویر ...

امروزه با شکسته شدن پی در پی استقلال ، شاخه های مختلف علوم و بهره وری شاخه ای از شاخه ی دیگر و پیشبرد مسائل پیچیده خود، پیوستگی و لاینفک بودن تمامی شاخه های علوم را نمایان تر می سازد که سرمنشأ تمامی آنها از یک حقیقت نشأت گرفته و آن ذات باری تعالی است.اولین تلاش ها به منظور ارائه ی یک مدل ریاضی برای سیستم عصبی انسان در دهه 40 توسط Mcculloch , pitts انجام شد ، که حاصل آن یک نورون ...

ثبت سفارش
تعداد
عنوان محصول