Під час карантину студенти кафедри прикладної лінгвістики Інституту комп’ютерних наук та інформаційних технологій Львівської політехніки продовжили брати участь у наповненні корпусу української мови ГРАК, переклали з англійської мови інструкцію до CQL.
Студенти Університету підготували для ГРАКа корпус журналу «Всесвіт» (1958–1983 рр.) обсягом 14,5 мільйона слів і близько 400 родинних листів.
Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дає змогу будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їхні сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки й одержувати різну статистичну інформацію.
Корпус призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.