ÀÚÀ¯°Ô½ÃÆÇ

  HOME     Ä¿¹Â´ÏƼ     ÀÚÀ¯°Ô½ÃÆÇ

ÀÛ¼ºÀÚ À̽°ü ÀÛ¼ºÀÏ 2020-12-04
Á¦¸ñ »ê¾÷Ä«¿î½½·¯ÀÇ ¿ªÇÒ°ú ±â´ë (167) : Text Language Processing Á¶È¸¼ö 1527
÷ºÎÆÄÀÏ  


 

ÅØ½ºÆ® ¾ð¾îó¸®(Text Language Processing)

1. ÀÇÀÇ

ÀΰøÁö´É¿¡ ¾²ÀÌ´Â ¼ö¸¹Àº µ¥ÀÌÅÍ´Â Àΰ£ÀÇ ¸»À̳ª ±ÛÀÌ´Ù. ƯÈ÷ ¸¹Àº ¹®¼­, ó¹æÀü, ½Å¹®´º½º µîÀº ÅØ½ºÆ®·Î ÀÛ¼ºµÇ¾î ÀÖ´Ù. ÀÌ·¯ÇÑ ÅØ½ºÆ®¸¦ ÀÎÅÍ³Ý °Ë»ö, À½¼ºÀÎ½Ä ½ºÇÇÄ¿, ½ºÆÔ¸ÞÀÏ ºÐ·ù µî¿¡ »ç¿ëÇϰí ÀÖ´Ù.

2. ³»¿ë

ÀÚ¿¬¾î ÀΰøÁö´É´Â ÀϹÝÀûÀÎ ¼Ò¸®³ª À̹ÌÁö, ¿µ»ó µîÀÌ ¾Æ´Ñ ¾ð¾î·Î ±¸¼ºµÈ ´ëÈ­³ª ÅØ½ºÆ®·Î ÀÌ·ç¾îÁø µ¥ÀÌÅͰ¡ ÁÖ¿ä ¼Ò½º´Ù. ÅØ½ºÆ® ¸¶ÀÌ´×°ú ÀÚ¿¬¾î ó¸®(Natural Language Processing/NLP)´Â ƯÈ÷ ÅØ½ºÆ®·Î ÀÛ¼ºµÈ µ¥ÀÌÅ͸¦ ó¸®ÇÏ´Â °ÍÀÌ´Ù.

ÅØ½ºÆ® ¸¶ÀÌ´×Àº ÀÚ¿¬¾î ÀÔ·Â ÅØ½ºÆ®¸¦ ±¸Á¶È­Çϰí, ÆÐÅÏÀ» ¹ß°ßÇϸç, »êÃâ °á°ú¹°À» Æò°¡Çϰí ÇØ¼®Çϸç Àǹ̰¡ ÀÖ´Â Á¤º¸¸¦ »Ì¾Æ³»´Â ±â¹ýÀ̰í, ÀÚ¿¬¾î ó¸®(NLP)´Â ÅØ½ºÆ®¸¦ »ç¿ëÇÏ¿© ±â°èÇнÀÀ» ÇÏ´Â ÀΰøÁö´É ¹æ½ÄÀÌ´Ù.

3. È¿°ú

ÅØ½ºÆ®·Î µÈ ÀÚ¿¬¾î 󸮸¦ À§ÇÑ È帧Àº Åäūȭ(°¡Àå ÀÛÀº ¾ð¾î´ÜÀ§·Î ¹®Àå ³»ÀÇ ÅØ½ºÆ®¸¦ ¼ø¼­´ë·Î ³ª´®), ¾î°£ ó¸®(stemming, »ç¶ûÇÏ´Â »ç¶û½º·¯¿î »ç¶ûÀ» ¹Þ´Â »ç¶ûÀ» ÁÖ·Á°í -> »ç¶ûÇÏ´Ù), Ç¥Á¦¾î ã±â(goes, went, gone -> go), ǰ»ç/ÇüÅÂ¼Ò ºÐ¼®(part-of-speech tagging, ¹®Àå ³»¿¡¼­ ǰ»ç¸¦ ±¸ºÐ), °³Ã¼¸í ºÐ¼®(Named entity recognition), ÀçÁ¶ÇÕ(Chunking, °³º° Á¤º¸¸¦ ¸ð¾Æ¼­ Çϳª·Î ÀçÁ¶ÇÕ)ÀÇ ÀÚ¿¬¾î ó¸®(NLP)°¡ °¡´ÉÇÏ°Ô µÈ´Ù.

À̽°ü ¼º³²»ê¾÷´ÜÁö°ü¸®°ø´Ü ¼ö¼®Àü¹®À§¿ø °æ¿µÇÐ¹Ú»ç °æ¿µÁöµµ»ç »ê¾÷Ä«¿î½½·¯ 1±Þ ¼º³²ÇÏÀÌÅ×Å©¹ë¸® À¶ÇÕÇõ½Å±â¼úÁö¿ø¼¾ÅÍ °æ¿µÇõ½ÅºÐ°úÀ§¿øÀå