УКРАЇНСЬКИЙ ВОРДНЕТ ЯК ІНСТРУМЕНТ ІНТЕГРАЦІЇ УКРАЇНСЬКОЇ МОВИ У СВІТОВИЙ МОВНИЙ ПРОСТІР
Анотація
У цій статті розглянуто основні проблеми, пов’язані з процесами створення, розширення та редагування Українету – українського ворднету. Як представник родини ворднетів, Українет – це сучасний віртуальний мовний ресурс, який містить поняття (концепти), виражені рядами лексичних синонімів (синсетів) разом з їхніми означеннями, прикладами вживання та зазначенням лексико-семантичних відношень між поняттями – гіперонімія / гіпонімія, меронімія / голонімія, антонімія. Такі ресурси забезпечують важливу інформацію для різноманітних процесів опрацювання природної мови – машинного перекладу, перефразування, семантичного аналізу тексту тощо. Реальні й близькі перспективи включення української мови в коло мов Євросоюзу робить такий ресурс украй важливим. Тож створення Українету, яке стало можливим завдяки співпраці українських і німецьких фахівців, поставило Україну в один ряд із передовими в технологічному сенсі державами. Особливу увагу було приділено узгодженню лексикографічної інформації, що походить із різних джерел – таких як традиційні словники, Відкритий англійський ворднет (Open English WordNet), польський ворднет та інші ворднети. Було проаналізовано різні випадки синонімії – зокрема, лексичної (як різновиду формальної) та змістової синонімії – а також гіпо-гіперонімії, наявні у Відкритому англійському ворднеті та в звичайних термінологічних фізичних і фонетичних словниках. Було зіставлено також означення термінів у цих джерелах. Було виявлено, що традиційні словники не містять усіх необхідних гіпо-гіперонімічних відношень, а означення слів у ворднетах часто є неточними або неповними. Тому ворднети потребують істотного лексикографічного доопрацювання. Ця процедура передбачає включення додаткових лексичних одиниць для заповнення семантичних лакун, уточнення означень, а також уведення нових понять і семантичних зв’язків, зокрема гіпо- та гіперонімічних, які пов’язані з уточненими означеннями. Ворднети є майбутнім лексикографії.