워드 클라우드의 모양을 바꾸는 방법에 대해 알아보자.
먼저 워드 클라우드를 만드는 방법을 빠르게 정리해보자.
from wordcloud import WordCloud, STOPWORDS
spam_email_list = spam['text'].tolist()
spam_email = ''.join(spam_email_list)
워드 클라우드를 사용하려면 ,
1. 판다스의 스팸컬럼에 저장된 문자열을, 리스트로 먼저 받아오고 (tolist 함수 사용)
2. 리스트에 있는 문자열을 다 합쳐서 하나의 문자열로 만들어준다. (join 함수 사용)

# 불용어 라이브러리 불러오고 단어 추가하기
my_stopwords = STOPWORDS
my_stopwords.add('subject')
my_stopwords.add('will')
my_stopwords.add('new')
STOPWORDS 라이브러리로 불용어를 불러오고 추가한다.
# 이미지 파일을 준비한다.
# png 파일로 투명 배경이 있는 이미지를 구해오면 구한 이미지 모양으로 만들 수 있다.
from PIL import Image
img = Image.open('sen_baloon.png')
img_mask = np.array(img)
wc = WordCloud(background_color= 'white', mask = img_mask, stopwords = my_stopwords)
wc.generate(spam_email)
png 파일을 준비한 후
from PIL import Image 으로 라이브러리를 불러오고
np.array로 이미지를 수치화시킨 후 WordCloud 함수의 파라미터 mask의 값을 수치화시킨 이미지 변수를 지정해준다.
plt.figure(figsize = (15,9))
plt.imshow(wc)
plt.axis('off')
plt.show()
그 후 위와 같은 차트를 만들어준다.
'머신러닝 > 머신러닝 할 때 꼭 짚고 넘어갈 것' 카테고리의 다른 글
read_csv 함수의 error_bad_lines = False 파라미터의 사용법 (0) | 2022.05.11 |
---|---|
Pandas의 groupby 함수 사용법 (0) | 2022.05.11 |
Grid Serch 에 대해 알아보자. (0) | 2022.05.09 |
머신러닝에서 신규 데이터를 예측하는 순서 / Scaler (스케일러)나 Encoder(인코더)의 fit_transform() 과 transform() 함수 사용법 (0) | 2022.05.06 |
머신러닝 전 꼭 알고 가자! - Feature Scaling 의 2가지 방법 : StandardScaler(표준화), MinMaxScaler(정규화) (0) | 2022.05.05 |
댓글