NLP and others
24 April 2022
결론부터 이야기하자면, 오랜만에 읽은 좋은 전공 서적이었다. 또 서평 활동을 신청할 당시 내가 읽으리라고 기대했던 그런 류의 서적이었다. 시간이 조금만 지나면 의미가 없어지는 기술책이나 코드를 따라 쳐보면서 공부하는 기술 입문서가 아닌, 머릿속 한 구석에 숨어있다가 어느순간 탁 떠올라 연구에 인사이트를 제공해줄 그런 책.
지금은 데이터의 양만큼이나 질 또한 매우 중요한 시대가 되었다. 따라서 딥러닝을 배우는 입문자들은 데이터 전처리(pre-processing)을 통해 데이터를 최대한 쓸모있도록 만드는 법을 배운다. 또, 연구자가 데이터셋을 얼마나 이해하느냐가 모델 퍼포먼스를 좌지우지할 때도 있다. 그래서 연구나 대회를 시작하기에 앞서 EDA (Exploratory Data Analysis)를 수행하여 데이터의 특징을 파악하는 것이 중요하게 여겨지기도 한다. 즉 같은 데이터여도 사용자의 이해능력과 경험치에 따라 활용도가 상이해지는 것이다. 이 책은 데이터를 비판적인 시각으로 바라볼 수 있는 능력을 길러준다. 시멘틱 데이터를 다양한 시각에서 깊이있게 이해하고 시멘틱 모형을 만들때 필요로하는 비판적인 사고능력을 길러줄 것이다. 따라서, NLP를 공부하는 대학원생이나 NLP 엔지니어 및 연구자들이 한번쯤 읽어보길 추천한다. :)
Statement: 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.