– Ministerstwo Cyfryzacji ogłasza, że PLLuM (Polish Large Language Model) to nowa rodzina sztucznej inteligencji, która umożliwia przetwarzanie i generowanie tekstów w języku polskim. Model został stworzony przez polskich ekspertów z dziedziny IT i lingwistyki, i ma na celu wspieranie rozwoju kompetencji cyfrowych oraz innowacji w administracji publicznej i biznesie. Ministerstwo Cyfryzacji przedstawiło polski model językowy PLLuM oraz plan jego rozwoju. Od teraz model jest dostępny dla wszystkich użytkowników.
„PLLuM to przykład tego, jak możemy rozwijać nowoczesne technologie na naszych własnych warunkach, w naszym języku, z korzyścią dla obywateli. Tworzymy podstawę dla inteligentnych usług publicznych i innowacji, które będą rzeczywistym wsparciem zarówno dla administracji, jak i biznesu” – zaznacza wicepremier i minister cyfryzacji Krzysztof Gawkowski.
Witaj, jestem PLLuM. Oto dlaczego jestem wyjątkowy:
Nasz model językowy PLLuM jest elastyczny i skalowalny, korzystający od 8 do 70 miliardów parametrów. Dzięki temu jest w stanie generować precyzyjne treści w języku polskim. Mniejsze wersje są idealne do szybkich zadań, natomiast większe oferują wyższą precyzję i spójność językową. W naszej rodzinie modeli znajdują się także modele MoE (Mixture of Experts) zrównoważonym wyborem ekspertów oraz wyspecjalizowane modele RAG (Retrieval Augmented Generation).
– Dane wykorzystane w tej wersji pochodzą z etycznych źródeł, zgodnie z prawem autorskim i przepisami UE. Modele naukowe korzystają z ogólnodostępnych zbiorów danych, takich jak Common Crawl, natomiast wersje do użytku komercyjnego wykorzystują zasoby tekstowe od właścicieli, którzy udzielili licencji konsorcjum.
– Opracowany na autorskich zbiorach danych, zawierających dziesiątki tysięcy tzw. instrukcji – pobudzeń (promptów) i oczekiwanych odpowiedzi modelu – oraz preferencji – pobudzeń i różnych odpowiedzi modeli ocenionych pod kątem jakościowym – stworzony przez zespół ponad 50 specjalistów i specjalistek.
Wspieranie rozwoju polskich modeli językowych poprzez współpracę z modelem Bielik, co może przyczynić się do promowania rodzimej sztucznej inteligencji. Wspólny wysiłek w trenowaniu, pozyskiwaniu i udostępnianiu danych ma na celu poprawę jakości #AIMadeInPoland, z korzyścią dla administracji publicznej, biznesu i społeczeństwa.
Wzmacnianie ekosystemu rozwoju dużych modeli językowych w Polsce
„Inwestycja w rozwój PLLuM jest kluczowa dla transformacji cyfrowej państwa. Dotychczasowe środki w wysokości 14,5 mln zł pozwoliły na postęp projektu, a dodatkowe 19 mln zł umożliwi wdrożenie modelu w administracji publicznej i poszerzenie współpracy o nowych partnerów, takich jak COI i Cyfronet. W ten sposób PLLuM stanie się istotnym elementem cyfryzacji usług publicznych i rozwoju krajowego ekosystemu AI” – powiedział wiceminister cyfryzacji Dariusz Standerski.
Ministerstwo Cyfryzacji zleciło realizację projektu PLLuM i jest właścicielem wyników, kontrolując jego rozwój. Do tej pory prace realizowało konsorcjum sześciu podmiotów.
Partnerzy w projekcie to Politechnika Wrocławska, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, Naukowa i Akademicka Sieć Komputerowa (NASK-PIB), Ośrodek Przetwarzania Informacji (OPI-PIB) i Uniwersytet Łódzki.
PLLuM wyróżnia się na tle innych modeli językowych. Jest dostosowany do specyfiki języka polskiego oraz terminologii administracji publicznej. W procesie jego tworzenia stosuje kompleksowe procedury gromadzenia danych i oceny ich jakości. PLLuM przede wszystkim korzysta z danych organicznych – opracowywanych ręcznie, a nie przy użyciu innych modeli językowych. Trenowany na polskich zasobach, bardzo dobrze radzi sobie z wyzwaniami fleksji i złożonej składni generując precyzyjne treści.
PLLuM będzie oferować zaawansowane rozwiązania wspierające administrację publiczną, co przyczyni się do dalszej cyfryzacji Polski.
– W ramach mObywatel zostanie wprowadzony wirtualny asystent, który pomoże obywatelom w uzyskiwaniu informacji publicznych.
– Dodatkowo, inteligentny asystent urzędniczy automatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji oraz udzielanie odpowiedzi na pytania obywateli.
Edukacja ma potencjał do rozwoju aplikacji edukacyjnych, tłumaczeń oraz wsparcia nauczycieli w prowadzeniu angażujących lekcji przy użyciu najnowszych technologii.
Centralny Ośrodek Informatyki i ACK CYFRONET AGH dołączają do projektu jako partnerzy.
Ministerstwo Cyfryzacji przyznało konsorcjum dotację w wysokości 19 mln zł na dalszy rozwój projektu. Lider konsorcjum, HIVE – Ośrodek Badań nad Bezpieczeństwem SI w NASK, będzie koordynować prace wdrożeniowe PLLuM w usługach administracji publicznej.
W 2025 r. Centralny Ośrodek Informatyki dołączy do konsorcjum PLLuM, wdrażając model jako narzędzie dla urzędników i obywateli. Aplikacja zostanie wzbogacona o wirtualnego asystenta, który ułatwi korzystanie z usług administracji publicznej. Cyfronet AGH zapewni natomiast moc obliczeniową do uczenia modeli i ich udostępniania, korzystając z nowoczesnej infrastruktury obliczeniowej, w tym najszybszego superkomputera w Polsce.
Dzięki rozwojowi projektu oraz zaangażowaniu nowych partnerów – Centralnego Ośrodka Informatyki i CYFRONET-u, AI ma szansę na jeszcze szersze zastosowanie w życiu codziennym. Polska staje się jednym z liderów w rozwijaniu modeli językowych, co przekłada się na wzrost innowacyjności i konkurencyjności całej gospodarki.
Wykorzystanie inwestycji w sztuczną inteligencję może przyczynić się do rozwoju gospodarki i sektora IT. Rozwój PLLuM może wzmocnić konkurencyjność Polski, poprzez powstawanie nowych firm i produktów opartych na AI, co napędza wzrost gospodarczy. Wykorzystanie PLLuM w różnych obszarach może sprzyjać tworzeniu nowoczesnych rozwiązań, które umacniają pozycję Polski wśród liderów rozwoju AI.
PLLuM jest dostępny na stronie: http://pllum.clarin-pl.eu. Można pobrać modele na Hugging Face (https://router.huggingface.co/CYFRAGOVPL).
UWAGA: Komunikaty publikowane są w serwisie PAP bez wprowadzania przez PAP SA jakichkolwiek zmian w ich treści, w formie dostarczonej przez nadawcę. Nadawca komunikatu ponosi odpowiedzialność za jego treść – z zastrzeżeniem postanowień art. 42 ust. 2 ustawy prawo prasowe. (PAP)
Informacja pochodzi z serwisu: pap-mediaroom.pl