목록hadoop (1)
tellusboutyourself
[MapReduce] 파이썬으로 단어 별 빈도수 확인하기
리눅스 환경 - Rocky9 터미널 창 열기 하둡으로 접속 [root@localhost ~]# cd hadoop 1. mapper.py gedit으로 mapper.py를 만든다. [root@localhost hadoop]# gedit mapper.py #!/usr/bin/env python import sys for line in sys.stdin: words = line.strip().split() for word in words: print(f"{word}\\t{1}") 편집창에 위와 같이 입력 후 저장하고 닫기 다음 문장을 입력하면 [root@localhost hadoop]# echo "hello world python and hadoop" | ~/hadoop/mapper.p..
Hadoop
2024. 3. 7. 17:39