نوع فایل:PDF
تعداد صفحات :10
سال انتشار : 1394
چکیده
هدف ، ایجاد سیستمی با استفاده از ماشین بردار پشتیبان 8 به منظور تشخیص نوع لکنت 2 رخ داده در زبان فارسی، در افرادی که دچار اختلال در گفتار و لکنت هستند؛ میباشد. ایده اصلی، تشخیص نوع لکنت اتفاق افتاده در زبان فارسی با استفاده ازماشین بردار پشتیبان، است؛ تا متناسب با نوع لکنت تشخیص داده شده، رفتار و درمان متناسب، جهت اصلاح و بهبود آن صورت گیرد. چالش دیگری که در اینجا مطرح است، یافتن ویژگی یا ویژگیهایی است که در تشخیص نوع لکنت کاراهستند؛ و شناختن متغیر یا متغیرهایی، اعم از: جنسیت فرد، محدوده سنی و ...، که در تعیین نوع لکنت تاثیرگذار هستند.برای این منظور، ویژگیهای مختلفی روی سیگنالهای نمونه مورد استفاده را آزمون کردیم؛ بهترین دقت، برای روش Max FFT ، که توانست با دقت 89 %، سیگنالهای نمونه را بر اساس نوع لکنت رخ داده از هم تشخیص و تمییز دهد
واژگان کلیدی
لکنت، انواع لکنت، تشخیص لکنت، شبکه عصبی مصنوعی 3 ، ماشین بردار پشتیبان
نوع فایل :PDF
تعداد صفحات :
سال انتشار :1395
چکیده
اخیرا داده ها به صورت روز افزون و با سرعت بسیار زیادی درحال افزایش هستند . این داده ها، جریان داده نام دارند. امروزه به دلیل اهمیت و گستردگی کاربرد، و نیاز به استخراج پویای دانش موجود در جریان داده ها، داده کاوی جریان داده اهمیت بسزایی یافته است. از مهم ترین مشکلاتدر داده کاوی جریان داده وجود تغییر مفهوم به صورت ذاتی در این نوع داده هاست. به طور کلی تغییر مفهوم را می توان تغییر توزیع کلاس ها درداده های جریانی دانست. این مقاله با توجه به چالش اصلی در جریان داده، یک روش جدید برای طبقه بندی جریان داده ارائه می دهد. در این روش برای انجام عملیات طبقه بندی از ماشین بردار پشتیبان فازی ) FSVM ( استفاده می نماید. ویژگی بارز این روش در مقایسه با کارهای پیشین استفاده ازتئوری فازی برای مقابله با مشکل تغییر مفهوم در داده های جریانی می باشد. تحلیل های موجود و نتایج آزمایشگاهی نشان می دهد که مدل پیشنهاد شده دارای برتری قابل توجهی نسبت به مدل های قبلی می باشد
واژگان کلیدی
تغییر مفهوم، جریان داده، داده کاوی، طبقه بندی ، ماشین یردار پشتیبان فازی
واژگان کلیدی: طبقهبندی پوشش اراضی شهری، قطعهبندی تصویر، ویژگیهای شیگرا، الگوریتم جنگل تصادفی، انتخاب ویژگی، ماشین بردار پشتیبان، شبکههای عصبی، سنجش از دور
1-2 ضرورتها، انگیزهها و ویژگیهای تحقیق.. 4
1-5 معرفی اختصاری سایر فصول.. 7
فصل 2مروری بر تحقیقات پیشین.. 10
2-2 مروری بر روشهای طبقهبندی پوشش اراضی.. 10
2-2-1 فنهای طبقهبندی شیگرا.. 11
2-2-2 فنهای طبقهبندی نظارتنشده پیکسل-مبنا.. 12
2-2-3 فنهای طبقهبندی نظارتشده پیکسل-مبنا.. 12
2-3 مروری بر روشهای طبقهبندی جدید در سنجش از دور.. 13
2-3-1 طبقهبندی با شبکههای عصبی مصنوعی.. 14
2-3-2 طبقهبندی با درختان تصمیم.. 15
2-3-3 طبقهبندی با روشهای مبتنی بر ماشین بردار پشتیبان.. 15
2-3-4 فنهای طبقهبندی دانش-پایه.. 17
2-3-5 طبقهبندی با الگوریتمهای ترکیبی.. 18
2-4 روشهای انتخاب و کاهش فضای ویژگی.. 21
3-3 الگوریتمهای یادگیری متداول.. 27
3-3-4 طبقهبندیکننده بیز ساده.. 33
3-3-5 روشهای مبتنی بر ماشینهای بردار پشتیبان و کرنل.. 34
3-6-4 انتخاب ویژگی با کمک شاخص تعیین اهمیت ویژگی RF. 51
3-7-1 قطعهبندی به روش چند رزولوشنه.. 54
3-7-2 روش برآورد مقیاس مناسب برای قطعهبندی تصویر.. 58
4-2 دادهها و منطقه مورد مطالعه.. 64
4-3-1 انتخاب باند با کمک شاخص اهمیت ویژگی RF. 69
4-3-2 قطعهبندی تصویر ابرطیفی.. 70
4-4-1 نتایج ارزیابی دقت کلی و ضریب کاپا.. 74
4-4-2 ارزیابی زمانی روشهای طبقهبندی.. 79
4-4-3 نتایج طبقهبندی به تفکیک کلاسها.. 80
فصل 5نتیجهگیری و پیشنهادها.. 91
فهرست اشکال
شکل 3‑1: مرز تصمیم LDA بر روی یک مجموعه داده three-Gaussians. 27
شکل 3‑2: مثالی از درخت تصمیم.. 28
شکل 3‑3: مرز تصمیم یک درخت تصمیم بر روی مجموعه داده three-Gaussians. 31
شکل 3‑4: شکل (الف) یک نرون و (ب) یک شبکه عصبی.. 32
شکل 3‑5: نمایی از SVM خطی دوتایی.. 35
شکل 3‑7: تفکیک غیر-خطی با استفاده از فن کرنل SVMs (Bekkari et al., 2012) 38
شکل 3‑8: معماری یک روش دسته جمعی معمولی.. 39
شکل 3‑10: الگوریتم Bagging. 44
شکل 3‑12: الگوریتم تولید درخت تصادفی در RF. 48
شکل 3‑13: روند کلی الگوریتم جنگل تصادفی (Guo et al., 2011).. 49
شکل 3‑15: (راست) قطعهبندی Top-down؛ (چپ) قطعهبندی Bottom-up. 54
شکل 3‑17: نمایی از پلات ROC-LV.. 59
شکل 4‑1: نمایی از تصویر ابرطیفی با نمونههای مرجع.. 65
شکل 4‑2: نمایی از داده لیدار مورد مطالعه.. 65
شکل 4‑3: روند کل روش پیشنهادی.. 67
شکل 4‑4: الگوریتم افزایش تعداد نمونههای آموزشی با استفاده از احتمالات محاسبه شده با RF. 69
شکل 4‑5: اهمیت نرمال شده هر یک از باندهای تصویر ابرطیفی در طبقهبندی.. 70
شکل 4‑6: منحنی RMS شبکه عصبی برای 500 تکرار مرحله آموزش، (راست) برای NN و (چپ) برای PCA-NN.. 75
شکل 4‑7: نمودار ضریب کاپا روشهای طبقهبندی پیکسل-مبنای مختلف 77
شکل 4‑8: نمودار دقت کلی روشهای طبقهبندی پیکسل-مبنای مختلف 77
شکل 4‑9: نمودار ضریب کاپا روشهای مختلف طبقهبندی ویژگیهای شی-گرا 79
شکل 4‑10: نمودار دقت روشهای مختلف طبقهبندی ویژگیهای شی-گرا 79
شکل 4‑11: نمودار زمان محاسباتی روشهای مختلف طبقهبندی ویژگیهای شی-گرا.. 80
فهرست جداول
جدول 3‑1: ماتریس ابهام برای 3 کلاس.. 60
جدول 4‑1: اطلاعات مربوط به مجموعه دادههای استفاده شده.. 65
جدول 4‑2: تعداد نمونههای آموزشی و مرجع.. 66
جدول 4‑3 : قطعهبندی چند مقیاسه و پارامترهای آن.. 71
جدول 4‑4: فهرست ویژگیهای قابل استخراج از اشیا.. 72
جدول 4‑5: پارامترهای مورد نیاز برای شروع الگوریتمهای طبقهبندی 73
جدول 4‑6: جدول دقتهای طبقهبندی پیکسل-مبنا.. 76
جدول 4‑7: جدول دقتهای طبقهبندی شی-مبنا تصویر ابرطیفی و داده لیدار 78
جدول 4‑8: برآورد دقت طبقهبندی پیکسل-مبنای ویژگیهای لیدار و تصویر ابرطیفی.. 81
جدول 4‑9: برآورد دقت طبقهبندی پیکسل-مبنای 20 باند انتخاب شده از تصویر ابرطیفی.. 82
جدول 4‑10: برآورد دقت طبقهبندی شی-گرا در سطح 124 با نمونههای آموزشی اولیه.. 83
جدول 4‑11: برآورد دقت طبقهبندی شی-گرا در سطح 124 با نمونههای آموزشی حاصل از RF. 84
فصل اول
مقدمه
در زندگی امروزی داشتن اطلاعات بهروز، یک برتری بزرگ به شمار میآید که به تصمیمگیری درست و زندگی بهتر در جوامع انسانی منجر میشود. یکی از مهمتر ین اطلاعات، نقشههای بهروز پوشش اراضی است که برای تصمیمگیری صحیح و مدیریت و برنامهریزی آگاهانه برای مدیران (شهری) مورد نیاز است.
سنجش از دور یک منبع غنی برای تولید بسیاری از اطلاعات مکانی و محیطی است و یکی از بنیادیترین اطلاعاتی که تولید میکند نقشههای پوشش اراضی است . اطلاعات پوشش اراضی برای تولید نقشههای کاربری اراضی، مطالعه تغییرات محیطی و برقراری ارتباط بین عوامل انسانی مختلف و متغیرهای فیزیکی محیط مورد استفاده قرار میگیرد. برای تولید نقشههای پوشش اراضی ابتدا بایستی این اطلاعات از تصاویر ماهوارهای و دادههای دیگر استخراج شود. تفسیر بصری و الگوریتمهای یادگیری ماشینی دو روش متداول برای استخراج اطلاعات از تصاویر ماهوارههای و دادههای سنجش از دور است، که هر یک دارای مزایا و معایبی میباشند. در برخی موارد استخراج اطلاعات از تصاویر ماهوارهای و هوایی توسط عامل انسانی نتایج مطلوبتری نسبت به روشهای خودکار یا نیمه خودکار تولید میکند. اما در جوامع امروزی تولید اطلاعات توسط عامل انسانی و به روشهای سنتی دیگر پاسخگوی نیازهای موجود نیست و لازم است روشهای خودکار و عاری از دخالت انسان توسعه داده شود. در این راستا پیوسته الگوریتمهای یادگیری جدیدتری توسعه داده میشود تا این نیاز را برطرف سازد. در زمینه استخراج اطلاعات از تصاویر سنجش از دور به روش سنتی، مسائلی که بایستی مورد توجه واقع شود عبارتاند از: 1- حجم زیاد و رشد سریع دادهها و تصاویر در سنجش از دور، 2- زمانبر بودن استخراج اطلاعات توسط انسان و از طرف دیگر 3- پیچیدگی عوارض برای تفسیر بصری و استخراج به وسیله چشم ممکن است باعث خطا گردد و در برخی موارد نیز استخراج اطلاعات به این روش غیرممکن میشود. راهحل این مسئله استفاده از الگوریتمهای یادگیری ماشینی است که هدف نهایی آنها استخراج اطلاعات بدون دخالت انسان است . مهمتر ین کاری که الگوریتمهای یادگیری ماشینی در سنجش از دور انجام میدهند طبقهبندی دادهها به کلاسهای اطلاعاتی است. الگوریتمهای یادگیری ماشینی متداول در سنجش از دور مثل روشهای طبقهبندی بیشینه شباهت (MLC[1])، ماشین بردار پشتیبان (SVM[2]) و شبکههای عصبی مصنوعی (ANN[3]) دارای مشکلاتی مثل 1- نیازمندی به دادههای آموزشی زیاد و بدون خطا، 2- نیازمندی به تعیین بهینه و صحیح پارامترهای آغازکننده، 3- محاسبات زیاد و 4- دقت پایین در استخراج اطلاعات هستند. جنگل تصادفی (RF[4]) یک الگوریتم یادگیری ماشینی جدید است که با ترکیب طبقهبندیکنندههای درختی نتایج رضایتبخشی را در طبقهبندی تولید میکند همچنین استفاده از این روش میتواند برخی از مشکلات مطرح در الگوریتمهای قبلی را رفع کند.
ارزش اطلاعاتی یک تصویر بیشتر از هزار کلمه است. سنجش از دور تصاویری با اطلاعات گوناگون از محیط را در اختیار ما قرار میدهد. همان طور که گفته شد میتوان با طبقهبندی تصاویر به این اطلاعات دست یافت. در بیشتر موارد در طبقهبندی تصاویر از روشهای پیکسل-مبنا استفاده میشود. این روشها پیکسلهای تصویر را بر اساس اطلاعات عددی آنها طبقهبندی میکنند. اما معمولاً عوارضی که در اکثر موارد در یک تصویر به دنبال آن هستیم، تک پیکسلی نیستند بلکه به صورت مجموعهای از پیکسلها یا یک شی هستند. لذا در این تحقیق نیز با توجه به این که هدف طبقهبندی پوشش اراضی است و عوارض نهایی مورد نظر، تک پیکسلی نیستند، ابتدا یک قطعهبندی روی تصویر انجام میشود تا اشیا تصویری تولید شوند و سپس این اشیا با توجه به ویژگیهایی که دارند طبقهبندی میشوند تا کلاسهای اطلاعاتی پوشش اراضی را ارائه دهند.
در این تحقیق طبقهبندی هم به صورت پیکسل-مبنا و هم به صورت شی-مبنا با چند روش انجام میشود و نتایج هر یک مورد بحث و بررسی قرار میگیرد، تا در نهایت روشی مناسب از میان روشهای بررسیشده برای طبقهبندی پوشش اراضی شهری با استفاده از تصاویر ابرطیفی ارائه گردد. از آنجا پوشش اراضی شهری پیچیدهتر و مهمتر از پوشش اراضی طبیعی است در این تحقیق یک تصویر از یک صحنه شهری با عوارض مختلف مورد بررسی قرار گرفته است تا بتوانیم ارزیابی صحیحتری را به طور عملی از روشهای طبقهبندی مختلف انجام دهیم.