ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [영어 공부] 오만과 편견 (Pride and Prejudice)에서 가장 많이 나온 영어 단어는? 대사 편
    영어/오만과 편견 영어 공부 2020. 12. 29. 16:35
    반응형

    전편에서는 Jane Austen 오만과 편견 (Pride and Prejudice)에서 나온 모든 영어 단어의 빈도를 분석해 봤습니다. 소설이 특별한 것은 인물들의 대사와 상황에 대한 설명이 같이 있기 때문에 문어체와 구어체를 모두 볼 수 있다는 점입니다. 이번 포스트에서는 인물들의 대사를 분석 대상으로 하여 어떤 단어가 많이 나오는지 알아보도록 하겠습니다.

    오만과 편견 (Pride and Prejudice) 등장인물 대사 중 가장 많이 나온 영어 단어는?

    Jane Austen의 오만과 편견 (Pride and Prejudice)의 등장인물 대사에 나오는 모든 단어를 www.gutenberg.org에서 소설 txt 파일을 다운받아서 파이썬(Python)의 spaCy 라이브러리를 이용하여 분석하였습니다. 파이썬과 spaCy가 생소하신 분들은 일상 언어(자연어)를 분석하는 컴퓨터 프로그램이라고 생각하시면 쉬우실 것 같습니다. 독해에 나온 모든 단어 중 spaCy 라이브러리에서 stopword로 설정된 단어와 문장 기호(예, . , ? !)를 분석 대상에서 제외하였습니다.

     

    stopword는 문장의 의미에 큰 기여를 하지 않는 단어들을 지칭하는데 "the", "is", "in", "for", "to", "you", "I" 등을 가리킵니다. 보통 이런 단어들이 문장에서 사용되는 빈도가 가장 높아 일반적으로 자연어 분석에서는 제외하기 때문에 저도 분석에서 제외하였습니다. 더하여 모든 단어들은 원형(root)으로 변경하였습니다. 예를 들어 want와 wanted는 동일한 단어로 취급하였습니다.

     

    오만과 편견에서 사용된 총 단어수는 2739 이며 이 단어들이 사용된 횟수는 품사별로 아래의 표에 정리하였습니다. 총 16294번 카운트되었으며 가장 많이 나타난 명사(Noun), 동사(Verb), 형용사(Adjective), 고유명사(Proper noun), 부사(Adverb)는 별도의 칸에 나타내었고 나머지 품사는 Others에 합쳤습니다.

     

      NOUN VERB ADJ PROPN ADV Others
    Total_Count 6317 5014 2335 1421 937 270
    Ratio (%) 38.77 30.77 14.33 8.72 5.75 1.66

     

     

     

    Top 10 오만과 편견 등장인물 대사 중 가장 많이 나온 영어 단어

     

    가장 많이 나온 단어
    모든 품사를 포괄하여 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 모든 단어의 총 등장 횟수(16294)에 대한 비중을 의미합니다.

    1위 know 2위 think 3위 shall

     

    4위 Darcy 5위 sister 6위 father

     

    7위 Wickham 8위 man 9위 young 10위 believe 

     

     

    Top 10 오만과 편견 등장인물 대사 중 가장 많이 나온 명사

     

    가장 많이 나온 명사
    명사 중 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 품사가 명사인 단어의 총 등장 횟수에 대한 비중을 의미합니다.

    1위 sister 2위 father 3위 man

     

    4위 friend 5위 manner 6위 year

     

    7위 time 8위 lady 9위 family 10위 day 

     

     

     

     

    Top 10 오만과 편견 등장인물 대사 중 가장 많이 나온 동사

     

    가장 많이 나온 동사
    동사 중 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 품사가 동사인 단어의 총 등장 횟수에 대한 비중을 의미합니다.

    1위 know 2위 think 3위 shall

     

    4위 believe 5위 wish 6위 hope

     

    7위 tell 8위 hear 9위 come 10위 see 

     

     

     

    Top 10 오만과 편견 등장인물 대사 중 가장 많이 나온 형용사

     

    가장 많이 나온 형용사
    형용사 중 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 품사가 형용사인 단어의 총 등장 횟수에 대한 비중을 의미합니다.

    1위 young 2위 good 3위 great

     

    4위 little 5위 dear 6위 sure

     

    7위 certain 8위 strong 9위 happy 10위 ill 

     

     

     

    Top 10 오만과 편견 등장인물 대사 중 가장 많이 나온 부사

     

    가장 많이 나온 부사
    부사 중 가장 많이 등장한 단어 top 10을 선정하였습니다. 비율은 품사가 부사인 단어의 총 등장 횟수에 대한 비중을 의미합니다.

    1위 soon 2위 certainly 3위 particularly

     

    4위 far 5위 better 6위 perfectly

     

    7위 long 8위 ago 9위 absolutely 10위 away

     

     

     


    My Study Aid로 공부한 내용을 메모하고 자신만의 스터디 노트를 만들어 보세요.

    빠른 검색 기능과 랜덤화 기능으로 배운 내용을 쉽고 빠르게 복습해 보세요.

    (MSA 사용법 바로가기)

    구글 플레이 스토어 바로가기


     

    반응형

    댓글

Designed by Tistory.