문제
총 N개의 문자열로 이루어진 집합 S가 주어진다.
입력으로 주어지는 M개의 문자열 중에서 집합 S에 포함되어 있는 것이 총 몇 개인지 구하는 프로그램을 작성하시오.
입력
첫째 줄에 문자열의 개수 N과 M (1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000)이 주어진다.
다음 N개의 줄에는 집합 S에 포함되어 있는 문자열들이 주어진다.
다음 M개의 줄에는 검사해야 하는 문자열들이 주어진다.
입력으로 주어지는 문자열은 알파벳 소문자로만 이루어져 있으며, 길이는 500을 넘지 않는다. 집합 S에 같은 문자열이 여러 번 주어지는 경우는 없다.
출력
첫째 줄에 M개의 문자열 중에 총 몇 개가 집합 S에 포함되어 있는지 출력한다.
<첫번째 코드>
import sys
input = sys.stdin.readline
n, m=map(int,input().split())
arr_n=[]
arr_m=[]
count=0
for i in range(n):
arr_n.append(input())
for i in range(m):
arr_m.append(input())
for i in range(m):
for j in range(n):
if arr_n[j]==arr_m[i]:
count+=1
print(count)
무난하게 생각할 수 있는 for loop를 이용하여 이중 반복문을 시도하였으나 시간초과가 나왔다.
<두번째 코드>
import sys
input = sys.stdin.readline
n, m=map(int,input().split())
arr_n=set()
arr_m=set()
for i in range(n):
arr_n.add(input())
for i in range(m):
arr_m.add(input())
count=arr_n & arr_m
print(len(count))
그래서 생각해낸 것이 리스트가 아닌 set(집합) 자료구조를 이용한 방법이었다.
교집합을 이용해서 공통범위를 찾겠다는 생각이었다.
코드에 오류가 없다고 생각하고 여러번 시도해보았지만 계속 틀렸다고 나와서 그 이유를 곰곰히 생각해 본 결과,
틀린 이유는 다음과 같았다.
set에서는 서로 같은 원소를 중복을 허용하여 다른 원소로 보지 않기 때문에 M개의 문자열 중 중복되는 것이 있어도 서로 같은 것으로 취급하기 때문이었다.
<세번째 수정(사실8번째 시도): 정답코드>
import sys
input = sys.stdin.readline
n, m = map(int, input().split())
arr_n = []
arr_m = []
count = 0
for i in range(n):
arr_n.append(input())
for i in range(m):
arr_m.append(input())
for i in range(m):
if arr_m[i] in arr_n:
count += 1
print(count)
어쩔 수 없이 in 연산자와 for 문을 결합하니 오류가 나지 않았다.