1000자 이상일 때 감정 분석

3300자를 넣는다고 가정

1~1000 / 1001 ~ 2000 / 2001 ~ 3000 / 3001 ~3300

감정 분석 결과가 총 4개가 나오게 됨

이 4개의 결과값을 모두 합친 후 4로 나누어서 긍정 부정 중립 퍼센트를 얻고 이 퍼센트를 통해 감정 결과를 정함

근데 3001~3300은 다른 1000자짜리 결과에 비해 300자라는 작은 길이임에도 1000자 짜리와 동일한 가중치를 갖고 감정 분석 결과에 영향을 미치게 됨

따라서 1000자 블럭과 작은 블럭이 존재할 때 두 블럭 사이에 가중치를 어떻게 설정할지를 결정해야 함

ex)

1200짜리 글의 첫 1000자는 모두 긍정적인 글로 채우고, 뒤의 200자는 모두 부정적인 글로 채우는 상황을 가정

1~1000 / 1001~1200으로 분석이 진행되어 감정 분석 결과가 총 2개로 100 0 0 긍정 / 0 100 0 부정이 나오게 됨

현재는 각 블럭의 길이에 대한 가중치가 없어서 두 결과값을 합치고 반으로 나누어서 50 50 0 중립이 결과로 나오게 됨

1200자 중에 1000자를 긍정적인 글로 채웠음에도 결과가 중립으로 나오는 극단적인 경우가 발생함

Nginx

[Nginx] Nginx 개념 및 nginx.conf 설정

역할