Парсирање је граматички вежба која укључује разбијање текста на његове саставне делове говора уз објашњење форме, функције и синтацтиц однос сваког дела тако да се текст може разумети. Израз "рашчлањивање" потиче од латинског парс за "део (говора)."
У савременој лингвистици, рашчлањивање се обично односи на компјутерски синтактичку анализу језика. Рачунарски програми који аутоматски додају ознаке за рашчлањивање у а текст се зове парсери.
Кључни одвоји: разгледање
- Разврставање је процес рашчлањивања реченице на њене елементе како би се реченица могла разумјети.
- Традиционално рашчлањивање се врши ручно, понекад се користе дијаграми реченица. Парсинг је такође укључен у сложеније облике анализе као што су анализа дискурса и психолингвистика.
Анализа дефиниције
Ин лингвистика, до рашчланити значи разбити реченицу у њену саставни дијелови тако да се значење реченице може разумети. Понекад се рашчлањивање врши уз помоћ алата као што су дијаграми реченица (визуелни прикази синтактичких конструкција). Приликом рашчлањивања реченице читалац узима у обзир елементе реченице и њихове делове говора (било да је реч именица, глагол, придев, итд.). Читалац примећује и друге елементе као што су глагол тенсе (садашње време, прошло време, будуће време, итд.). Једном када се реченица разбије, читалац може помоћу своје анализе да протумачи значење реченице.
Неки лингвисти праве разлику између "пуног рашчлањивања" и "костурног рашчлањивања". Прва се односи на потпуну анализу текста, укључујући што је могуће детаљнији опис његових елемената. Потоњи се односи на једноставнији облик анализе који се користи да би се схватио основни смисао реченице.
Традиционалне методе парирања
Традиционално, парсирање се врши узимањем реченице и разбијањем на различите делове говора. Речи се постављају у различите граматичке категорије, а затим се препознају граматички односи између речи, што читаоцу омогућава тумачење реченице. На пример, узмите следећу реченицу:
- Човек отвори врата.
Да бисмо анализирали ову реченицу, прво разврстимо сваку реч по њеном делу говора: тхе тхе (чланак), човек (именица), отворен (верб), тхе тхе (чланак), врата (именица). Реченица има само један глагол (отворен); тада можемо идентификовати предмет и објект тог глагола. У овом случају, пошто човек изводи радњу, субјект је човек а објект је врата. Јер глагол је отворен-радије него отвара се или отвориће се- знамо да је реченица у прошлом времену, што значи да је описана радња већ наступила. Овај пример је једноставан, али показује како се рашчлањивање може користити за осветљавање значења текста. Традиционалне методе рашчлањивања могу или не морају укључивати дијаграме реченица. Оваква визуелна помагала су понекад корисна када су реченице које се анализирају посебно сложене.
Анализа дискурса
За разлику од једноставног рашчлањивања, анализа дискурса односи се на шире поље истраживања које се бави социјалним и психолошким аспектима језика. Они који врше анализу дискурса занимају, између осталих тема, жанрове језика (оне са одређеним) одредити конвенције унутар различитих области) и односе између језика и друштвеног понашања, политике и меморија. На овај начин, анализа дискурса надилази опсег традиционалног рашчлањивања, који је ограничен на појединачне текстове.
Психолингвистика
Психолингвистика је област проучавања која се бави језиком и његовом везом са психологијом и неурознаношћу. Научници који раде на овом пољу проучавају начине на који мозак обрађује језик, претварајући знакове и симболе у смислене изјаве. Као такви, пре свега их занимају основни процеси који омогућавају традиционално рашчлањивање. Занима их, на пример, како различите структуре мозга олакшавају усвајање и разумевање језика.
Рачунално потпомогнуто разгледавање
Рачунарска лингвистика је поље проучавања у којем су научници користили приступ заснован на правилима да би развили рачунарске моделе људских језика. Овај рад комбинује рачунарску науку са когнитивном науком, математиком, филозофијом и вештачком интелигенцијом. Помоћу компјутерског рашчлањивања научници могу да користе алгоритме за обављање анализе текста. Ово је посебно корисно научницима јер се, за разлику од традиционалног рашчлањивања, такви алати могу брзо користити анализирати велику количину текста, откривајући обрасце и друге информације које није лако добити иначе. На пример, у пољу дигиталних хуманистичких наука, на пример, компјутерски потпомогнут рашчлањивање коришћен је за анализу Схакеспеареових дела; у 2016. години, историчари књижевности су из рачунарске анализе представе закључили да Цхристопхер Марлове био је коаутор Схакеспеареових "Хенри ВИ."
Један од изазова компјутерски потпомогнутом рашчлањивању јесте то што су рачунарски модели језика засновани на правилима, што значи да научници морају рећи алгоритам како да интерпретирају одређене структуре и обрасце. Међутим, у стварном људском језику такве структуре и обрасци немају увек иста значења, а лингвисти морају да анализирају појединачне примере да би утврдили принципе који њима управљају.
Извори
- Довти, Давид Р. и др. "Разматрање природног језика: психолошка, рачунарска и теоријска перспектива." Цамбридге Университи Пресс, 2005.
- Халлеи, Нед. "Речник модерног енглеског језика у Вордсвортху: граматика, синтакса и стил за 21. век." Вордсвортх Едитионс, 2001.