Data Experts
1.45K subscribers
213 photos
61 videos
38 files
171 links
متخصصین داده - مطالب علم داده و نرم‌افزارها و آموزش‌های این حوزه
Admin :
@javad_vahdat

YouTube:
https://www.youtube.com/@dataexperts
加入频道
#متن_کاوی
#انالیز_متن_کاوی
#پردازش_زبان_طبیعی
#NLP
#پردازش_متن

داده کاوی در متن در زمان های مختلف بر اساس کاربرد و روش شناسی مورد استفاده، به صورت پردازش متن آماری، کشف دانش در متن، آنالیز هوشمند متن یا پردازش زبان طبیعی تعیین شده است. به عنوان مثال هایی از کارهایی که متن کاوی انجام می دهد می توان به دسته بندی یا classifying اسناد به مجموعه ای از تاپیک های مشخص (یادگیری با نظارت)، گروه بندی کردن اسناد به طوری که هر یک از اعضای هر گروه معنای مشابهی داشته باشد (کلاسترینگ یا یادگیری بدون ناظر) و یافتن اسنادی که برخی از معیارهای جستجو را satisfy کند (information Retrieval یا بازیابی اطلاعات) اشاره کرد.
متن كاوي به عنوان تجزيه و تحليل هوشمند متن، داده كاوي متن يا كشف دانش در متن نيز شناخته ميشود. متن كاوي بر روي داده هاي متني غير ساختيافته و نيمه ساختيافته تعريف مي گردد داده هاي متني غير ساخت يافته مانند صفحات وب، يادداشت، صورتحساب و …. و داده های متنی نيمه ساخت يافته مانند XML, HTML… .
╭──•═✾🔘✾═•──╮
••• @Data_Experts •••
──•═✾🔝✾═•──╯
چندین تکنیک برای متن کاوی پیشنهاد شده است عبارتند از ساختار مفهومی،کاوش association ruleها درخت تصمیم گیری، روش های استنتاج قوانین، همچنین تکنیک های بازیابی اطلاعات برای کارهایی مانند تطبیق دادن سندها، مرتب کردن کردن، کلاسترینگ و…. از جمله مشکلاتی که در زمینه متن کاوی وجود دارد کشف کردن دانش مفید از متن نیمه ساخت یافته یا غیرساخت یافته است که توجه زیادی را به خود جلب کرده است.
پس متن كاوي يكي از زمينه هاي است كه به دنبال استخراج اطلاعات مفيد، از داده هاي متني بدون ساختار، به وسيله شناسايي و اكتشاف الگوها مي باشد. ايده اصلي متن كاوي، يافتن قطعات كوچك اطلاعات ازحجم زياد داده هاي متني، بدون نياز به خواندن تمام آن است. متن کاوی با انتقال کلمات و عبارات که بصورت داده های unstructured یا غیر ساخت یافته هستند به مقادیر عددی عمل می کند که پس از آن می تواند این داده های غیر ساخت یافته را به داده های ساخت یافته در یک پایگاه داده لینک داد و آن را با استفاده از روش های سنتی داده کاوی آنالیز کرد. به استفاده از روش های متن کاوی برای حل مسائل بیزینسی یا کسب و کار text analytics می گویند. متن کاوی به سازمان ها این امکان را می دهد که بینش تجاری ارزشمندی از محتواهای مبتنی بر متن خود مانند اسناد word ، ایمیل و پست هایی که در استریم رسانه های اجتماعی مانند فیسبوک و توئیتر و linkedIn وجود دارد به دست آورند.
کاوش داده های غیر ساخت یافته با پردازش زبان طبیعی (NLP)، مدلسازی آماری و روش های یادگیری ماشین ممکن است سخت و چالش برانگیز باشد چون متن های زبان طبیعی اغلب متناقض هستند.

«با ما همراه باشید و متخصص علم داده شوید»
╭──•═✾🔘✾═•──╮
••• @Data_Experts •••
──•═✾🔝✾═•──╯
#پردازش_زبان_طبيعي
#NLP

نقش nlp در متن کاوی استفاده کامپیوتر برای پردازش زبان گفتاری و نوشتاری انسان و هدف از پردازش زبان طبیعی اینست که به کامپیوترها در پردازش زبان طبیعی به عنوان ورودی و خروجی استفاده کنند .از معایب استفاده از nlp درک دشوار در فهمیدن معانی کلمات در یک جمله که مستقل از گرامر است و گرامر بسیاری از زبانهای طبیعی دقیق نیست .
╭──•═✾🔘✾═•──╮
••• @Data_Experts •••
──•═✾🔝✾═•──╯
از چالشهای موجود در nlp برچسب گذاری ادات سخن(برچسبگذاری عبارتهای در یک نامه و تشخیص اینکه فاعل و ضمیر کاری دشوار است وتنها به افعال و صفات بستگی ندارد) بلکه به زمینه ادات که در آن بکار رفته واسبته است.

بخش بندی متون: در برخی از زبانهای فارسی وچینی ... که یک کلمه یا واژه دارای معانی متفاوتی است و تجزیه متن نیاز به شناسایی مرزهای مختلف معنایی اون کلمه است.
ابهام زادیی کلمات: با وجود معنای متفاوت از کلمات انتخاب معنی مناسب کلمه کاری دشوار است.
╭──•═✾🔘✾═•──╮
••• @Data_Experts •••
──•═✾🔝✾═•──╯
ادامه دارد
#پردازش_زبان_طبيعي
#NLP
کاربردهای پردازش زبان طبیعی را میتوان در موارد زیر خلاصه کرد.
بازیابی اطلاعات
استخراج اطلاعات
پاسخگویی به سوالات
خلاصه سازس خودکار
ایجاد زبان طبیعی
درک زبان طبیعی
ترجمه ماشینی
خواندن و نوشتن زبان خارجی
تشخیص گفتار
تبدیل متن به گفتار
رفع اشتباهات متون
و...
برای انجام هرکدوم از این موارد در عمل نیاز به درک درستی از برنامه نویسی می باشد .

با تیم ما همراه باشید تا یک پژوهشگر علم داده شوید

╭──•═✾🔘✾═•──╮
••• @Data_Experts •••
──•═✾🔝✾═•──╯