Po raz kolejny współpraca między Wydziałem Filologii Polskiej i Klasycznej UAM, Poznańskim Centrum Superkomputerowo-Sieciowym i Urzędem Miasta Poznania została doceniona. Stworzony wspólnie program „Proste Pismo” ‒ służący do upraszczania skomplikowanych pism oficjalnych ‒ będzie wykorzystywany przez specjalny zespół zajmujący się polską prezydencją w Radzie Unii Europejskiej.
Ze strony naszego Wydziału we współpracę zaangażowani są językoznawcy, prof. UAM dr hab. Jarosław Liberek i prof. UAM dr hab. Karolina Ruta-Korytowska, a od niedawna również studentki II roku filologii polskiej II stopnia: pani Paulina Poniatowska i pani Sandra Kaczmarek. Dzięki wspólnym działaniom udało się stworzyć bazę tekstów urzędowych i program „Proste Pismo”, który łączy zalety edytora do redakcyjnego i automatycznego upraszczania pism.
W ramach polskiego przewodnictwa w Radzie UE w obiegu publicznym pojawi się mnóstwo tekstów oficjalnych. Wypada się cieszyć, że przynajmniej część tych tekstów może okazać się łatwiejsza w odbiorze dzięki naszym naukowcom. Warto podkreślić, że w czasie konkurowania różnych modeli sztucznej inteligencji również i u nas powstają narzędzia porównywalne z narzędziami zagranicznymi.
Zobacz, jak o wykorzystywaniu poznańskiego „Prostego Pisma” opowiada p. Magdalena Sobkowiak, podsekretarz stanu ds. europejskich w Kancelarii Prezesa Rady Ministrów: #prostyjezyk #plainlanguage #bielik #poland25eu | Magdalena Sobkowiak
W 2023 roku „Proste Pismo” zostało wzbogacone oryginalnym modułem sztucznej inteligencji (SI). Specjaliści z PCSS zastosowali model LLM (Large Language Model) o architekturze Transformer typu BART (Bidirectional and Auto-Regressive Transformer). Dzięki pomocy naszych językoznawców został on dotrenowany na podstawie pochodzącego z bazy zbioru około 5 tys. oryginalnych (eksperckich) mapowań zdanie na zdanie. Wykorzystując eksperckie mapowania, wygenerowano automatycznie, przy użyciu innego, otwartego modelu GPT, kolejnych 10 tys. mapowań typu akapit (3-5 zdań) na akapit, które następnie poddano manualnej weryfikacji i dołączono do zbioru treningowego. Podnoszenie sprawności maszyny trwa, a zasób tekstów służących trenowaniu sukcesywnie się powiększa.
„Proste Pismo” korzysta nie tylko z poznańskiego modelu BART PP, ale również ze stworzonego na krakowskiej AGH modelu Bielik-11B-v2, aby urzędnicy mogli szybciej wypracować optymalną w danej sytuacji wersję pisma.