پژوهشکده فناوری ارتباطات

استخدام توسعه‌دهنده خزشگر وب (Web Crawler)

پژوهشکده فناوری ارتباطات
امکان دورکاری

توضیحات فرصت شغلی

ما در تیم ذکاوت داده‌های شبکه‌های اجتماعی و ... برای پردازش و تحلیل جمع‌آوری می کنیم. همکاری که در این سمت در کنار ما قرار می‌گیره باید بتونه خزشگرهایی رو در لایه‌ی گردآوری و خزش فضای وب که شامل بسترهای متفاوتی میشه بنویسه و گردآوری داده رو پشتیبانی کنه و همچنین با توجه به پویایی و چالشی بودن کار ویژگی‌های زیر رو داشته باشه:

  • مسئولیت پذیر
  • باپشتکار و انگیزه
  • متعهد
  • عاشق یادگیری و روبه‌رویی با چالش‌ها


مهارت‌های مورد نیاز برای این سمت شغلی:

  • آشنایی با ساختار خزش وب
  • برنامه نویسی پایتون
  • برنامه نویسی جاوا

تکنولوژی‌ها

    PythonJavaSelenium
لوگوی شرکت پژوهشکده فناوری ارتباطات

پژوهشکده فناوری ارتباطات

فناوری اطلاعات، نرم‌افزار و سخت‌افزار

۱۱-۵۰ نفر

تیم ذکاوت

به گزارش روابط عمومی پژوهشگاه ارتباطات و فناوری اطلاعات، همگام با طراحی و توسعه سامانه ذکاوت(ذائقه‌سنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره برداری قرار گرفت.

گفتنی است از آن‌جایی که متن‌های منتشرشده در پیام‌رسان/ شبکه‌های اجتماعی به صورت عامیانه می‌باشند و پردازش زبان فارسی یکی از ارکان پایه‌ای تحلیل محتوای متنی است، لذا بر اساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاوره‌ای) نیز توسط پروژه‌ "طراحی و ایجاد بستر تحلیل ترافیک و ذائقه سنجی کاربران فضای مجازی" توسعه داده شده و در سامانه ذکاوت، طی پروژه توسعه ذکاوت در فاز اول عملیاتی شده است.

به گفته مهندس لیلا ربیعی مجری پروژه‌های مذکور و مدیر گروه توسعه سرویس و مدیریت منابع هوش مصنوعی پژوهشگاه ICT، این سکو شامل ابزارهای تشخیص موجودیت‌های نامدار (NER)، نرمال‌ساز فارسی(Normalizer)، برچسب‌زن ادات سخن(POSTagger) و چانکر(chunker) می‌باشد، که به صورت API قابلیت ارائه خدمات را خواهد داشت. لازم به توضیح است که پیکره‌ای شامل ۵۰۰ هزار توکن فارسی از متون عامیانه شبکه‌های اجتماعی جهت توسعه‌ی ابزارهای برچسب‌زن ادات سخن و چانکر، توسط تیم زبان‌شناسی برچسب‌گذاری شده است.

لازم به ذکر است پژوهشگاه ارتباطات و فناوری اطلاعات در آزمایشگاه‌های مرکز توسعه و نوآوری هوش مصنوعی جهت ارائه خدمت به دانشجویان و محققان این حوزه اعلام آمادگی می‌نماید.

پژوهشگاه ارتباطات و فناوری اطلاعات (مرکز تحقیقات مخابرات) ایران، یکی از قدیمی‌ترین نهادهای پژوهشی حاکمیتی در حوزه فاوا و مغز متفکر و مشاور مادر وزارت ارتباطات و فناوری اطلاعات به شمار می‌رود. از ماموریت‌های اصلی این پژوهشگاه نهادینه کردن رشد و ارتقای وضعیت دانش، فناوری و نوآوری کشور با بسترسازی و برنامه‌ریزی خردمندانه همراستا با اولویت‌های تعیین شده در اساسنامه، احکام و اسناد بالادستی کشور می‌باشد.

 


اطلاعات تماس

https://www.itrc.ac.ir

تهران