ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [영어 공부] 오만과 편견 (Pride and Prejudice)에서 가장 많이 나온 영어 단어는?
    영어/오만과 편견 영어 공부 2020. 12. 22. 17:27
    반응형

    영어 공부는 다양한 채널을 통해서 하는 것이 가장 좋다고 생각합니다. 보통 시험공부를 위해서 영어 공부를 하기 때문에 시험에 나오는 글 위주로 영어를 접하게 됩니다. 이번 포스트에서는 방향을 달리해서 영어로 된 소설에서는 어떤 단어를 사용하는지 알아보도록 하겠습니다. 이번에 분석한 소설은 Jane Austen오만과 편견 (Pride and Prejudice)입니다. 참고로 오만과 편견은 오래된 작품이기 때문에 저작권이 없습니다. 

    오만과 편견 (Pride and Prejudice)에서 가장 많이 나온 단어는?

    Jane Austen의 오만과 편견 (Pride and Prejudice)에 등장하는 모든 단어를 www.gutenberg.org에서 소설 txt 파일을 다운받아서 파이썬(Python)의 spaCy 라이브러리를 이용하여 분석하였습니다. 파이썬과 spaCy가 생소하신 분들은 일상 언어(자연어)를 분석하는 컴퓨터 프로그램이라고 생각하시면 쉬우실 것 같습니다. 독해에 나온 모든 단어 중 spaCy 라이브러리에서 stopword로 설정된 단어와 문장 기호(예, . , ? !)를 분석 대상에서 제외하였습니다.

     

    stopword는 문장의 의미에 큰 기여를 하지 않는 단어들을 지칭하는데 "the", "is", "in", "for", "to", "you", "I" 등을 가리킵니다. 보통 이런 단어들이 문장에서 사용되는 빈도가 가장 높아 일반적으로 자연어 분석에서는 제외하기 때문에 저도 분석에서 제외하였습니다. 더하여 모든 단어들은 원형(root)으로 변경하였습니다. 예를 들어 want와 wanted는 동일한 단어로 취급하였습니다.

     

    오만과 편견에서 사용된 총 단어수는 4181 이며 이 단어들이 사용된 횟수는 품사별로 아래의 표에 정리하였습니다. 총 27375번 카운트되었으며 가장 많이 나타난 명사(Noun), 동사(Verb), 형용사(Adjective), 고유명사(Proper noun), 부사(Adverb)는 별도의 칸에 나타내었고 나머지 품사는 Others에 합쳤습니다.

     

      NOUN VERB ADJ PROPN ADV Others
    Total_Count 10336 8205 3530 3409 1558 337
    Ratio (%) 37.76 29.97 12.89 12.45 5.69 1.23

     

     

     

    Top 10 오만과 편견에서 가장 많이 나온 단어

     

     

    오만과 편견 단어
    모든 품사를 포괄하여 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 모든 단어의 총 등장 횟수(27375)에 대한 비중을 의미합니다.

    1위 Elizabeth 2위 say 3위 Darcy

     

    4위 Bingley 5위 think 6위 Miss

     

    7위 Bennet 8위 know 9위 Jane 10위 sister 

     

     

    Top 10 오만과 편견에서 가장 많이 나온 명사

     

    오만과 편견 명사
    명사 중 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 품사가 명사인 단어의 총 등장 횟수에 대한 비중을 의미합니다.

    1위 sister 2위 man 3위 time

     

    4위 friend 5위 lady 6위 day

     

    7위 room 8위 manner 9위 family 10위 father 

     

     

     

     

    Top 10 오만과 편견에서 가장 많이 나온 동사

     

    오만과 편견 동사
    동사 중 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 품사가 동사인 단어의 총 등장 횟수에 대한 비중을 의미합니다.

    1위 say 2위 think 3위 know

     

    4위 see 5위 hear 6위 come

     

    7위 speak 8위 shall 9위 feel 10위 believe 

     

     

     

    Top 10 오만과 편견에서 가장 많이 나온 형용사

     

    오만과 편견 형용사
    형용사 중 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 품사가 형용사인 단어의 총 등장 횟수에 대한 비중을 의미합니다.

    1위 young 2위 good 3위 great

     

    4위 little 5위 dear 6위 sure

     

    7위 happy 8위 agreeable 9위 general 10위 certain 

     

     

     

    Top 10 오만과 편견에서 가장 많이 나온 부사

     

    오만과 편견 부사
    부사 중 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 품사가 부사인 단어의 총 등장 횟수에 대한 비중을 의미합니다.

    1위 soon 2위 away 3위 certainly

     

    4위 immediately 5위 long 6위 better

     

    7위 far 8위 perfectly 9위 longer 10위 merely

     

     

     


    My Study Aid로 공부한 내용을 메모하고 자신만의 스터디 노트를 만들어 보세요.

    빠른 검색 기능과 랜덤화 기능으로 배운 내용을 쉽고 빠르게 복습해 보세요.

    (MSA 사용법 바로가기)

    구글 플레이 스토어 바로가기


     

    반응형

    댓글

Designed by Tistory.