SQL 기초 실무/빅데이터 문제 풀기

23.10.04. SQL Developer 빅데이터 분석하기 ②

잇꼬 2023. 10. 4. 08:42
728x90
반응형
SMALL

2. 스티븐 잡스 연설문 (2005년) 에서 가장 많이 나오는 단어는 무엇인지 SQL로 출력하기.

--예제127. 스티븐 잡스 연설문에서 가장 많이 나오는 단어는?
-- 잘못되었을 경우 :  truncate table speech ;

create table speech
    ( speech_text varchar2(1000) );

select count(*) from speech ;

select * from speech ; 

select regexp_substr ( 'I never graduated from college', '[^ ]+', 1, 2) word
    from dual ;
    
select regexp_substr(lower(speech_text) , '[^ ]+', 1, a) word
    from speech , ( select level a 
                                from dual 
                                connect by level <= 52 ) ; -- 한 문장에 52개의 어절이 넘어가지 않는다.

select word, count(*) -- 단어 카운트하기
    from ( 
                select regexp_substr(lower(speech_text), '[^ ]+', 1, a) word
                    from speech, ( select level a
                                                from dual 
                                                connect by level <= 52 )
                )
    where word is not null -- (null) 카운트 제외
    group by word
    order by count(*) desc ; -- 가장 많이 나오는 순으로 출력

 

jobs.txt
0.01MB

728x90
반응형
LIST