Stylometrix czyli badania NLP w NASKu - dr Inez Okulska
Wywiad z dr Inez Okulską z Państwowego Instytutu Badawczego NASK.
Rozmawiamy m.in:
- o tym, jaka była rola NASKu we wprowadzaniu Internetu do Polski i jak kontynuuje to dzieło dziś,
- o działalności naukowej prowadzonej przez NASK *(zwanej dalej "Małym Stanford")
- o tym, czym zajmuje się Zakład Inżynierii Lingwistycznej i Analizy Tekstu kierowany przez Inez
- o wspomaganiu moderatorów serwisu Wykop
- o obciążeniu psychicznym osób monitorujących treści w Internecie
- o tym, czym jest model StyloMetrix i o rodzajach metryk, które można do niego samodzielnie dodawać
- o polskiej i angielskiej wersji SpaCy
- o tym, czy zawsze wielkie modele transformerowe są lepsze od tych mniejszych, opartych o wiedzę lingwistyczną
- o klasyfikacji tekstów bez zaglądania w ich treść
- a także o kluczowej roli styku biznes-nauka, bez której obie strony tracą wiele możliwości