Web Analytics Made Easy - Statcounter

به گزارش خبرگزاری صدا و سیما، به نقل ازمرکز ارتباطات و اطلاع رسانی معاونت علمی، فناوری و اقتصاد دانش بنیان، «دادگان» با کمک هوش مصنوعی و ابزارهای مرتبط به این فناوری جدید و به روز، اقدام به جمع‌آوری داده‌ها و کلان داده‌ها کرده و در نهایت به ارتقاء سطح کمی و کیفی کسب و کارها کمک شایانی می‌کند.     در دنیای دیجیتالی اهمیت داده‌ها و اطلاعات بسیار بیش از گذشته برای کسب‌وکارها مشخص و نمایان شده، به طوری که بسیاری از کارشناسان و فعالان حوزه کلان داده‌ها و داده‌ها از آنها به عنوان یک منبع درآمدزایی بزرگ در سطح منابع انرژی یاد می‌کنند.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!

در جهان کسب‌وکار امروز، این، داده‌ها هستند که کسب‌وکارها را جهت‌دهی می‌کنند و به عنوان نقشه راهی برای آینده آنها عمل می‌کنند.   به طور مثال، داده‌های رفتار خریداران و مصرف‌کنندگان  یک سامانه فروشگاهی می‌تواند به صاحبان کسب‌وکار نشان دهد که خریداران و مصرف‌کنندگان دقیقاً به چه چیزهایی نیاز دارند و نسبت به همین داده‌ها و اطلاعات اقدام به تأمین نیازهای مشتریان خود کند. مثال‌هایی که تعداد آنها بسیار زیاد‌ و متنوع هستند   از این روی، استخراج اطلاعات مهم از بین انبوهی از داده‌ها و رسیدن به بینشی درست یکی از تخصص‌های بسیار مهم است که برای بقای کسب و کارهایی که با کلان داده‌ها سر و کار دارند اهمیت بسیاری دارد و می‌توان با توسعه دادن هوش مصنوعی از آن برای استخراج داده‌ها و داده کاوی هوشمند استفاده کرد.   ستاد اقتصاد دانش‌بنیان دیجیتال نیز برنامه ویژه‌ای را برای استخراج، دسته‌بندی و استفاده از این داده‌ها برای کسب‌وکارها و نهادهای مختلف در دستور کار خود قرار داد که نتیجه این تلاش‌ها به طراحی و بهره‌برداری از سایتی به نام دادگان انجامیده است.    بررسی و معرفی بخش‌های مختلف سایت دادگان شامل:   پیکواد، پیکره‌ای برای کمک به پژوهش بر روی درک مطلب ماشینی و توسعه سیستم‌های پرسش و پاسخ به زبان فارسی   پیکواد یک مجموعه داده برای درک مطلب ماشینی به زبان فارسی است. این مجموعه شامل 80 هزار سوال به همراه پاسخ آن‌ها است. سوالات پیکواد از مقالات ویکی‌پدیای فارسی استخراج شده‌اند. جمع کل پاراگراف‌ها ۱۱هزارتا است که به هزار و ۱۲۵ مقاله تعلق دارد و طیف وسیعی از موضوع‌ها را پوشش می‌دهند.   پیکواد به عنوان یک مجموعه داده درک مطلب ماشینی نیاز به یک سیستم پرسش و پاسخ دارد تا یک متن را بخواند و سپس سوالات مطرح شده از آن متن را پاسخ بدهد. هدف از انتشار این مجموعه داده کمک به پژوهش بر روی درک مطلب ماشینی و توسعه سیستم‌های پرسش و پاسخ به زبان فارسی است. از لحاظ ساختاری می‌توان گفت پیکواد شباهت‌هایی به برخی قابلیت‌های نرم‌افزار هوش مصنوعی چت جی‌پی‌تی (GPT) دارد.   پیکره و مشابهت‌یابی معنایی جملات با استفاده از فناوری هوش مصنوعی:   یکی دیگر از بخش‌های سامانه دادگان پیکره و ماژول مشابهت‌یابی معنای جملات است. هدف این طرح ایجاد یک پیکره شباهت معنایی برای زبان فارسی است. در اینجا، منظور از شباهت معنایی فاصله معنایی بین دو جمله است، یعنی این که دو جمله از نظر محتوای واژگانی و موضوع کلی تا چه اندازه به هم شبیه یا از هم متفاوت هستند.   پیکره و فناوری گفتگوی روزمره زبان فارسی:   بخش سوم سامانه دادگان، پیکره و فناوری گفتگوی روزمره زبان فارسی است. این پیکره، نخستین پیکره زبان فارسی گفتگوهای فیلم و سریال های ایرانی به زبان فارسی و مناسب برای فناوری گفتگوی روزمره فارسی است که در ربات‌های مجازی هوشمند ایرانی مورد استفاده قرار می گیرد به گفته مسئولین این سامانه، پیکره فیلم وسریال دارای 100 هزار و 34 گفته است که به این عدد باید تعداد یک میلیون و 289 هزار و 283 گفته پیکره شبکه های مجازی را نیز اضافه کرد که در میان سرویس‌های فارسی آمار خوبی محسوب می‌شود.   شایان ذکر است، دادگان برای راستی‌آزمایی داده‌های جمع‌آوری شده، علاوه بر ارزیابی های مبتنی بر هوش مصنوعی ارزیابی مرحله قبلی توسط هر برچسب زن انجام شده و به صورت تصادفی نمونه هایی از هر مرحله مورد ارزیابی قرار گرفته است.   پیکره محاوره به رسمی:   بخش چهارم و پایانی این سامانه نیز پیکره محاوره به رسمی است که کاربردهای بسیار زیادی خواهد داشت. در این طرح حدود ۵۰ هزار جمله محاوره به معادل رسمی آنها تبدیل شده اند. پیکره حاصله شامل 50 هزار زوج جمله محاوره ای- رسمی و همترازی کلمات آنهاست. به عبارت دیگر علاوه بر زوج جملات معادل، برای هر جمله محاوره ای مشخص شده کدام کلمه یا عبارت آن، معادل با کدام کلمه یا عبارت در جمله رسمی است.   جملات محاوره ای از منابعی چون شبکه های اجتماعی مانند اینستاگرام و توئیتر، پیام رسان‌هایی مانند تلگرام و واتس‌اپ، صفحات وب، وبلاگ ها، کتاب ها و فیلم هاجمع آوری شده یا توسط خود داده آمارها تولید شده‌اند.   در این پیکره تقریبا نیمی از جملات محاوره ای از ساختار نحوی رسمی برخوردار نبوده و برای تبدیل آنها به شکل رسمی علاوه بر تغییر واژه های محاوره ای نیاز به اصلاح ساختار دستوری نیز بوده است.    هوش مصنوعی در واقع همان علمی است که به ماشین‌ها کمک می‌کند تا همانند یک انسان هوشمند رفتار کنند و بتوانند وظایف مختلفی را اجرا کنند. هوشمند شدن هوش مصنوعی نیز به وسیله داده اتفاق می‌افتد. به این صورت که برای اینکه هوش مصنوعی بتواند یک مشکل در حوزه‌ای خاص را حل کند، داده‌ها و اطلاعات مربوط به آن را جمع آوری می‌کند تا از آن‌ها برای آموزش سیستم استفاده کند.   به گفته مسئولان این سامانه، در این برهه از زمان که کاربست فناوری‌های دیجیتال، در تمامی ساحات زندگی بشر جلوه‌گر شده، ضرورت توجه متمرکز به آنان با وضوح بیشتری نسبت به گذشته بر همگان عیان شده است . بنابراین مرکز توسعه فناوری های نو ظهور دیجیتال در نظر دارد با حمایت وکمک به توسعه زیر ساخت های این فناوری های جدید عرصه را برای حضور و توسعه زیست بوم دانش بنیان فراهم نماید .   علاقه‌مندان می‌توانند برای کسب اطلاعات و آگاهی از قابلیت‌های این سایت به نشانی https://data-edt.ir/ مراجعه کنند.  

منبع: خبرگزاری صدا و سیما

کلیدواژه: زبان فارسی زبان فارسی هوش مصنوعی محاوره ای داده ها جمع آوری

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت www.iribnews.ir دریافت کرده‌است، لذا منبع این خبر، وبسایت «خبرگزاری صدا و سیما» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۸۵۰۷۵۶۶ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

سرویس استعلام آنلاین ملک در شهرداری‌های کلانشهرها راه‌اندازی می‌شود

رئیس کمیسیون فناوری اطلاعات و شهر هوشمند کلانشهرهای کشور گفت: سرویس استعلام ملک از سازمان ثبت اسناد کشور به صورت پایلوت در اختیار شهرداری‌های قم و تبریز قرار گرفته و به زودی در کلانشهرهای راه‌اندازی می‌شود.

به گزارش خبرگزاری ایمنا از آذربایجان‌غربی، سی‌امین نشست کمیسیون فناوری اطلاعات و شهر هوشمند مجمع شهرداران کلانشهرها امروز _پنجشنبه سیزدهم اردیبهشت_ به صورت مجازی برگزار شد.

در این نشست که به ریاست یاسر اسدپور رئیس و امیر بیات دبیر کمیسیون فناوری اطلاعات و شهر هوشمند و رؤسای فناوری اطلاعات ۲۰ کلانشهر کشور تشکیل یافته بود، مباحث مرتبط با موضوع توسعه پروژه‌های فیبرنوری (جهت ارائه اینترنت پرسرعت به منازل و کسب‌وکارها) و همچنین ایجاد ارتباط سیستمی بین سامانه‌های شهرسازی شهرداری‌ها و سازمان ثبت اسناد کشور بررسی شد.

اسدپور در این جلسه ضمن اشاره به اهمیت توسعه فیبرنوری و کمک شهرداری‌ها برای پیشرفت و توسعه شبکه‌های فیبرنوری در کشور و به ویژه کلانشهرها اظهار کرد: کمیسیون فناوری اطلاعات و شهر هوشمند و مدیران فاوای کلانشهرها وظیفه سنگینی در راستای این پروژه دارند.

وی در این راستا افزود: از یک سو باید تلاش داشته باشند که شرایط را برای اجرای پرشتاب این پروژه فراهم سازند و از یک طرف نیز باید سعی کنند در اجرای پروژه ملی فیبرنوری، شهروندان کمتر به زحمت بیافتند.

رئیس کمیسیون فناوری اطلاعات و شهر هوشمند مجمع شهرداران کلانشهرها گفت: در اجرای پروژه فیبرنوری همچنین منافع شهرداری و شهروندان به صورت دوسویه لحاظ شود.

اسدپور با اشاره به دعوت از معاون فناوری اطلاعات و خدمات الکترونیکی سازمان ثبت اسناد کشور به نشست بیست‌وهفتم کمیسیون فناوری اطلاعات و شهر هوشمند تصریح کرد: با همکاری و مساعدت ایشان و پیگیری‌های لازم از سوی کمیسیون و سازمان فناوری اطلاعات شهرداری قم سرویس استعلام ملک از سوی سازمان ثبت اسناد در اختیار کلانشهرها قرار گرفت.

وی ادامه داد: این سرویس به صورت پایلوت در اختیار شهرداری‌های قم و تبریز قرار گرفته است و به زودی در اختیار تمامی کلانشهرهای کشور قرار خواهد گرفت.

اسدپور یادآور شد: سرویس استعلام ملک می‌تواند به شهرداری‌ها در فرآیند صدور پروانه الکترونیکی و به‌روزرسانی دیتابیس و اطلاعات مالکین کمک فراوانی کرده و در راستای تکریم ارباب رجوع و شهروندان گام مثبتی برداشته شود.

در این ادامه این نشست آنلاین هریک از رؤسای سازمان‌های فناوری اطلاعات کلانشهرها گزارشی از میزان پیشرفت پروژه فیبرنوری در شهرهای خود ارائه و همچنین ایرادات و کاستی‌های آن را تشریح کردند که ریاست کمیسیون وعده پیگیری موارد مطرح شده را از مجمع کلانشهرها و سازمان تنظیم مقررات رادیویی را داد تا با برطرف کردن موانع پیشرفت پروژه در کمترین مدت ممکن با سرعت و شتاب بیشتری ادامه یابد.

در پایان این نشست سه ساعته حجازی ریاست سازمان فناوری اطلاعات و ارتباطات شهرداری قم نیز طی سخنانی به مزایای سامانه ارتباط سیستمی شهرداری با ثبت اسناد کشور اشاره کرد و ریاست کمیسیون نیز از پیگیری و جدیت ریاست فاوای قم قدردانی خود را ابراز کرد.

کد خبر 750171

دیگر خبرها

  • چالش‌های زیست‌محیطی در توسعه هوش مصنوعی
  • سرویس استعلام آنلاین ملک در شهرداری‌های کلانشهرها راه‌اندازی می‌شود
  • نظارت تصویری با هوش مصنوعی
  • دستیار هوشمند خانگی/ هوش مصنوعی چگونه به خانه‌داری کمک می‌کند؟
  • هوش مصنوعی بی طرف نیست ؛ چشم بسته در جنگ شلیک می کند
  • دانشکده هوش مصنوعی در دانشگاه آزاد تبریز راه‌اندازی می‌شود
  • ایجاد دانشکده فناوری‌های راهبردی در دانشگاه مازندران
  • هوش مصنوعی چگونه به معماران و طراحان کمک می‌کند؟
  • وضع مقررات برای استفاده تسلیحاتی از هوش مصنوعی
  • راه‌اندازی پارک علم و فناوری در عراق با استفاده از ظرفیت‌های پارک فناوری تهران