2020년 5급 PSAT 상황판단 39번~40번 해설 (나책형)

    문제지 필기 및 특이사항

    2020년 5급 PSAT 상황판단 나책형 39번~40번 문제다.

    이 지문은 참 반가웠다. 내가 바둑깨나 두는 관계로(인터넷에서 8~9단쯤 둔다) 알파고가 등장했을 때 스터디를 무지 빡세게 했기 때문. 알파고가 두각을 드러내기 전까지 내가 못 이기는 인공지능이 없었는데… 껄껄.

    본 해설은 타 해설을 참고하거나 검수를 받지 않고 작성되었습니다.

    2020년 5급 PSAT 상황판단 39번~40번 해설·풀이과정

    <39번 정답: 5번>

    최초에는 동일한 인공신경망이라고 해도 강화학습의 유무에 따라 인공신경망의 가중치는 달라질 수 있다.

     

    강화학습은 다른 조건이 동일한 상태에서 가중치만 다른 인공신경망끼리 대국시켜 최적의 가중치를 찾는 과정이다. 이때 지도학습을 통해 얻어낸 가중치를 적용한 인공신경망이 다른 가중치를 적용한 인공신경망에게 주로 패배한다면 이긴 쪽 가중치를 적용한다. 따라서 강화학습 유무에 따라 가중치가 달라질 수 있다.

     

    <39번 오답 해설>

     

    ① 오답을 통한 학습과정을 더 많이 거칠수록 인공신경망의 정확도는 떨어진다.

    (문단2) 오답에 따른 학습을 반복할수록 인공신경망 정확도는 향상된다.

     

    ② 알파고는 가중치를 최적화하는 과정에서 기보 한 건당 1,000건 이상의 착점을 학습했다.

    (문단3) 알파고가 가중치 최적화 과정에서 사용한 기보는 16만 건, 거기서 추출된 착점은 3,000만 건이다. 한 건당 1,000건은 택도 없다.

     

    ③ 알파고는 빠른 데이터 처리 능력 덕분에 인터넷 기보를 이용한 지도학습만으로도 정확한 형세판단 능력의 평가 함수를 찾을 수 있었다.

    (문단5) 형세판단을 위한 정확한 평가 함수는 강화학습 방식으로 찾아낼 수 있다.

     

    ④ 알파고가 바둑의 형세를 판단하도록 하기 위해서 프로그래머는 정확한 평가 함수를 알아야 한다.

    (문단5) 정확한 평가 함수를 프로그래머가 알아야 할 필요가 없다.

    ※ 여담으로 알파고 프로그래머도 알파고가 둔 수들의 의미를 이해하기 어렵다. 프로들도 종종 수십 수가 지나서야 수의 의미를 발견하곤 한다.

     

    <40번 정답: 3번>

    가중치 A 0.4, 가중치 B 0.3

     

    강화학습 상황이다. 강화학습은 나머지 모든 조건이 동일한 상태에서 서로 다른 가중치를 가진 인공신경망끼리 대국시킨 뒤 주로 이긴 쪽의 가중치를 선택하는 방식이다. 어느 가중치가 이겼는지를 기록하면 다음과 같다.

     

    A 0.4 > A 0.3

    A 0.5 > A 0.3

    B 0.3 > B 0.4

    A 0.4 > A 0.5

    B 0.3 > B 0.2

     

    A 0.4가 A 0.3, A 0.5를 모두 이기므로 가중치 A는 0.4를 선택한다.

    B 0.3이 B 0.4, B 0.2를 모두 이기므로 가중치 B는 0.3를 선택한다.

     

    주관적 체감 난이도

    ★★☆☆☆

    지문이 길지만 소재 자체는 워낙 유명해진 것이기도 하고, 40번은 그 자체로는 별 하나를 줘도 무방할 만큼 쉽다.

    댓글

    밤도리 프리미엄콘텐츠 배너