Spichlerz / Speakleash - open source dataset z polskimi tekstami - Sebastian Kondracki
05.04.2023
00:44
Polish
Speakers:
Rozmowa z Sebastianem Kondrackim - jednym z założycieli projektu Spichlerz / Speakleash
Rozmawiamy na temat:
- czym jest projekt Spichlerz / speakleash
- ścieżce jaką przeszedł Sebastian poznając m.in ludzi z HuggingFace
- ilości danych potrzebnych, żeby trenować dobry model języka polskiego
- ochotnikach, którzy pracują przy projekcie
- etapie na jakim jest teraz projekt (update - ponad 140GB!)
- promowaniu polskich projektów Open Source
- osobach i organizacjach, które wspierają aktualnie Spichlerz