본문 바로가기
  • 콩's 코딩노트
머신러닝/머신러닝 할 때 꼭 짚고 넘어갈 것

WordCloud 에서 배경모양을 바꿔보자.

by Cong_S 2022. 5. 10.

워드 클라우드의 모양을 바꾸는 방법에 대해 알아보자.

먼저 워드 클라우드를 만드는 방법을 빠르게 정리해보자.

from wordcloud import WordCloud, STOPWORDS

spam_email_list = spam['text'].tolist()

spam_email = ''.join(spam_email_list)
워드 클라우드를 사용하려면 ,
1. 판다스의 스팸컬럼에 저장된 문자열을, 리스트로 먼저 받아오고 (tolist 함수 사용)
2. 리스트에 있는 문자열을 다 합쳐서 하나의 문자열로 만들어준다. (join 함수 사용)
 
하나의 문자열을 만들어준 모습
# 불용어 라이브러리 불러오고 단어 추가하기
my_stopwords = STOPWORDS

my_stopwords.add('subject')
my_stopwords.add('will')
my_stopwords.add('new')

STOPWORDS 라이브러리로 불용어를 불러오고 추가한다.

# 이미지 파일을 준비한다. 
# png 파일로 투명 배경이 있는 이미지를 구해오면 구한 이미지 모양으로 만들 수 있다.

from PIL import Image            

img = Image.open('sen_baloon.png')

img_mask = np.array(img)

wc = WordCloud(background_color= 'white', mask = img_mask, stopwords = my_stopwords) 

wc.generate(spam_email)

png 파일을 준비한 후

from PIL import Image  으로 라이브러리를 불러오고

np.array로 이미지를 수치화시킨 후  WordCloud 함수의 파라미터 mask의 값을 수치화시킨 이미지 변수를 지정해준다.

 

plt.figure(figsize = (15,9))
plt.imshow(wc)
plt.axis('off')
plt.show()

그 후 위와 같은 차트를 만들어준다.

 

 

댓글