임용고시/영어교육론

중등임용영어 Ch.13 Assessment OX 20문항 해설 완전 정복

obangti 2026. 5. 17. 13:44

[영어교육론] Ch.13 Assessment OX 20문항 — 해설 완전 정복

Ch.13 Assessment OX는 용어 자체보다 조건 판별이 핵심입니다. 비용·시간·운영이면 Practicality, score consistency면 Reliability, intended construct와 task 대응이면 Validity, feedback이 수업과 학습을 바꾸면 Washback입니다.

아래 해설은 정답만 확인하는 용도가 아니라, 실제 서술형에서 쓸 수 있는 answer-writing pattern까지 같이 잡도록 구성했습니다.


Q1. Practicality — ✅ O

"Practicality is best understood as financial, time, administration constraints, so it should be interpreted within its instructional or assessment context."

맞습니다. Practicality는 assessment가 reasonable amount of time and resources 안에서 create and administer될 수 있는지를 봅니다.

예를 들어 speaking interview가 construct 측면에서는 좋아도, 한 학급 전체를 평가하는 데 너무 오래 걸리고 trained raters를 확보할 수 없다면 classroom assessment로서 practicality가 낮습니다.

답안 패턴: The assessment has low practicality because it requires too much time/resources to administer in the given classroom context.


Q2. Practicality Misconception — ❌ X

"Practicality can be safely treated as the same as any neighboring concept because the distinction is mostly terminological."

틀립니다. Practicality는 "좋은 평가인가"를 포괄적으로 묻는 말이 아니라 운영 가능성을 묻는 quality입니다.

함정: "수업 목표와 잘 맞는다"는 Validity 쪽 단서이고, "채점이 일관적이다"는 Reliability 쪽 단서입니다. Practicality 답안에는 financial limitation, time constraint, ease of administration 중 하나가 살아 있어야 합니다.


Q3. Reliability — ✅ O

"Reliability is best understood as consistent and dependable results, so it should be interpreted within its instructional or assessment context."

맞습니다. Reliability는 test가 consistent and dependable results를 주는 정도입니다.

발문에서 같은 learner가 비슷한 조건에서 비슷한 score를 얻는지, rater가 달라져도 score가 유지되는지, 같은 rater가 기준을 일관되게 적용하는지 확인해야 합니다. 그래서 test-retest, equivalent-forms, split-half, inter-rater, intra-rater, internal consistency 같은 표현이 reliability 단서가 됩니다.

2014 기입10 / 2025 A-1 출제 영역


Q4. Reliability Misconception — ❌ X

"Reliability can be safely treated as the same as any neighboring concept because the distinction is mostly terminological."

틀립니다. Reliability는 score consistency의 문제입니다. Validity와 붙어서 나오지만 같은 개념이 아닙니다.

예를 들어 두 rater가 동일 rubric으로 거의 같은 score를 주면 reliability는 높을 수 있습니다. 그러나 그 rubric이 speaking ability를 pronunciation과 grammar만으로 평가한다면 intended construct를 충분히 반영하지 못해 construct validity가 낮을 수 있습니다.

한 줄 정리: Reliability는 "일관되게 재는가", Validity는 "제대로 재는가"입니다.


Q5. Validity — ✅ O

"Validity is best understood as content, face, construct, criterion-related, so it should be interpreted within its instructional or assessment context."

맞습니다. Validity는 test가 측정하려는 것을 실제로 측정하는 정도입니다.

Content validity는 domain과 objectives를 representative하게 sample하는지, construct validity는 theoretical construct를 제대로 반영하는지, face validity는 test-taker가 test를 적절하다고 느끼는지, criterion-related validity는 established criterion과의 relation을 보는지로 나뉩니다.

2011 Q24 / 2017 기입8 / 2026 A-8 출제 영역


Q6. Validity Misconception — ❌ X

"Validity can be safely treated as the same as any neighboring concept because the distinction is mostly terminological."

틀립니다. Validity는 assessment instrument와 intended construct/use의 관계를 묻습니다.

예를 들어 pronunciation skill을 평가한다고 하면서 isolated sounds만 묻고 stress, intonation, sounds within words를 배제하면 content validity가 약합니다. Oral interview에서 communicative competence를 본다고 하면서 pronunciation과 grammar만 채점하면 construct validity가 위협됩니다.

함정: "학생들이 test를 그럴듯하다고 느낀다"는 face validity이고, 그것만으로 content validity나 construct validity를 증명할 수 없습니다.


Q7. Authenticity and Interactiveness — ✅ O

"Authenticity and Interactiveness is best understood as target language use와 individual characteristics involvement, so it should be interpreted within its instructional or assessment context."

맞습니다. Authenticity는 test task가 target language use task와 대응하는 정도이고, Interactiveness는 learner의 individual characteristics가 task 수행에 관여하는 정도입니다.

Natural language, contextualized items, meaningful topics, thematic organization은 Authenticity 단서입니다. Language knowledge, metacognitive strategies, topical knowledge, affective schema가 필요하면 Interactiveness 단서입니다.

2012 Q25 / 2018 기입8 / 2025 A-9 출제 영역


Q8. Authenticity and Interactiveness Misconception — ❌ X

"Authenticity and Interactiveness can be safely treated as the same as any neighboring concept because the distinction is mostly terminological."

틀립니다. 둘 다 "좋은 communicative test"처럼 보일 수 있지만 판단 기준이 다릅니다.

Role play가 real-world task와 비슷하면 authenticity가 높습니다. 하지만 learner가 topic knowledge를 끌어오고, 상대 반응에 맞춰 language ability를 조절하고, anxiety나 confidence까지 영향을 받는다는 논거가 있어야 interactiveness까지 말할 수 있습니다.

답안 패턴: The task has high authenticity because it resembles target language use; it has high interactiveness because it engages learners' language knowledge, topical knowledge, and affective schemata.


Q9. Washback — ✅ O

"Washback is best understood as testing이 teaching/learning에 미치는 영향, so it should be interpreted within its instructional or assessment context."

맞습니다. Washback effect는 testing이 teaching과 learning에 미치는 영향입니다.

Specific feedback, useful diagnosis, goal setting은 beneficial washback을 만들 수 있습니다. 반대로 high-stakes test가 수업을 narrow test preparation으로 몰아가거나, simple letter grade만 제공해 learner가 다음 행동을 알 수 없게 하면 negative 또는 weak washback이 됩니다.

2014 기입10 / 2017 기입8 / 2018 기입7 / 2022 A-1 출제 영역


Q10. Washback Misconception — ❌ X

"Washback can be safely treated as the same as any neighboring concept because the distinction is mostly terminological."

틀립니다. Washback은 test의 "결과"가 아니라 test가 instruction과 learner behavior를 어떻게 바꾸는지까지 봅니다.

예를 들어 analytic rubric으로 strengths/weaknesses를 알려 주면 learner가 revision target을 잡을 수 있어 washback이 강해질 수 있습니다. 반대로 점수만 제시하면 learner가 무엇을 고쳐야 하는지 몰라 formative effect가 약합니다.

함정: Feedback이 존재한다는 말만으로 충분하지 않습니다. 그 feedback이 learner에게 diagnostic information을 주는지까지 써야 합니다.


Q11. Test Types — ✅ O

"Test Types is best understood as formative/summative, norm/criterion, direct/indirect, so it should be interpreted within its instructional or assessment context."

맞습니다. Test Types는 label이 아니라 purpose, score interpretation, task performance 기준으로 구분합니다.

Formative assessment는 instruction 중 learner development를 돕고, Summative assessment는 course end에서 achievement를 document합니다. Norm-referenced testing은 다른 test takers와 비교하고, Criterion-referenced testing은 mastery criterion이나 course objectives에 비추어 해석합니다.

2010 Q25 / 2011 Q29 / 2014 기입11 출제 영역


Q12. Test Types Misconception — ❌ X

"Test Types can be safely treated as the same as any neighboring concept because the distinction is mostly terminological."

틀립니다. Test type은 발문 속 기능으로 판별해야 합니다.

Learner를 appropriate level group에 넣기 위한 test는 Placement test이고, strengths/weaknesses를 찾아 곧바로 instruction에 반영하려는 test는 Diagnostic test입니다. 특정 course나 textbook에서 배운 내용을 얼마나 성취했는지 보는 test는 Achievement test이고, prior instruction과 무관한 overall proficiency를 보는 test는 Proficiency test입니다.

2010 Q26 / 2015 기입8 출제 영역


Q13. Alternative Assessment — ✅ O

"Alternative Assessment is best understood as portfolio, self-assessment, performance-based assessment, so it should be interpreted within its instructional or assessment context."

맞습니다. Alternative Assessment는 learner의 actual performance, process, reflection, teacher judgement를 중시하는 흐름으로 이해하면 됩니다.

Performance-based assessment는 productive and observable skills를 직접 수행하게 하고, meaningful, engaging, authentic tasks에서 process와 product를 함께 볼 수 있습니다. Portfolio는 learner work의 purposeful collection으로 efforts, progress, achievements를 보여 줍니다.

2010 Q29 / 2016 서술6 / 2018 서술6 출제 영역


Q14. Alternative Assessment Misconception — ❌ X

"Alternative Assessment can be safely treated as the same as any neighboring concept because the distinction is mostly terminological."

틀립니다. Portfolio, self-assessment, peer assessment는 공통적으로 learner involvement를 키우지만 각각 강조점이 다릅니다.

Portfolio는 progress와 achievement를 보여 주는 purposeful collection이고, Self-assessment는 learner가 자신의 process, strategies, outcomes를 점검하는 metacognitive activity입니다. Peer assessment는 writing revising stage에서 comments, questions, suggestions를 주고받는 cooperative learning 맥락으로 설명됩니다.

함정: Portfolio를 "결과물 파일철"로만 쓰면 부족합니다. efforts, progress, achievements, responsibility, autonomy까지 연결해야 합니다.


Q15. Scoring and Items — ✅ O

"Scoring and Items is best understood as holistic/analytic scoring, MC guidelines, item analysis, so it should be interpreted within its instructional or assessment context."

맞습니다. Holistic scoring은 composition as a whole에 대해 single score를 주고, Analytic scoring은 components를 따로 rating합니다.

Analytic scoring은 시간이 더 걸리지만 strengths/weaknesses를 보여 주고 specific diagnostic feedback을 제공할 수 있습니다. Holistic scoring은 fast evaluation과 easy interpretation에 유리하지만 diagnostic information이 약해 washback이 제한될 수 있습니다.

2021 논술2 / 2024 기입6 출제 영역


Q16. Scoring and Items Misconception — ❌ X

"Scoring and Items can be safely treated as the same as any neighboring concept because the distinction is mostly terminological."

틀립니다. Scoring 방식, item format, item analysis는 서로 다른 판단 기준을 가집니다.

Selected-response item은 ready-made list에서 answer를 고르는 item이고, constructed response item은 writing, speaking, doing을 통해 response를 만들어 내는 item입니다. Multiple-choice item에서는 stem이 concise and simple해야 하며, 하나의 clearly formulated problem만 묻고, distractors는 같은 grammatical/semantic category에 있어야 합니다.

2023 B-11 출제 영역


Q17. Practicality Review — ❌ X

"A learner can identify Practicality only by memorizing the label, without checking examples or classroom conditions."

틀립니다. Practicality는 label 암기가 아니라 classroom conditions 확인으로 잡아야 합니다.

인적·물적 자원 부족, 단기 준비 부담, 시범 운영 필요, 직원 채용, item bank 구축처럼 실제 운영 조건이 발문에 나오면 Practicality를 우선 의심합니다.

2023 A-1 출제 영역


Q18. Reliability Review — ❌ X

"A learner can identify Reliability only by memorizing the label, without checking examples or classroom conditions."

틀립니다. Reliability는 examples와 scoring/administering conditions를 확인해야 합니다.

서로 다른 교사가 동일 학생에게 다른 score를 주면 inter-rater reliability, 같은 rater가 일관되지 않게 scoring하면 intra-rater reliability 문제입니다. Rater training, clear rubric, scoring criteria 공유는 reliability 유지 방법으로 연결됩니다.

2012 Q23 / 2015 서술2 / 2018 서술2 / 2025 A-1 출제 영역


Q19. Validity Review — ❌ X

"A learner can identify Validity only by memorizing the label, without checking examples or classroom conditions."

틀립니다. Validity는 intended construct, test specifications, item/task alignment를 함께 확인해야 합니다.

문항이 main idea를 평가한다고 명세되어 있는데 실제 item이 specific detail만 묻거나, speaking competence를 평가한다면서 written recognition만 요구하면 validity 문제가 됩니다. 발문에서는 "무엇을 측정한다고 했는가"와 "실제 task가 무엇을 요구하는가"를 나란히 보아야 합니다.

2026 A-8 출제 영역


Q20. Authenticity and Interactiveness Review — ❌ X

"A learner can identify Authenticity and Interactiveness only by memorizing the label, without checking examples or classroom conditions."

틀립니다. Authenticity와 Interactiveness는 examples와 task conditions를 확인해야 합니다.

Memorable experience with friends처럼 real-life topic과 discourse purpose가 보이면 authenticity를 말할 수 있습니다. 그러나 interactiveness까지 쓰려면 learner의 language knowledge, topical knowledge, metacognitive strategies, affective schema가 task 수행에 관여한다는 근거를 붙여야 합니다.

마무리 패턴: 시험장에서 OX를 서술형으로 바꾸면, 항상 "term + evidence + effect" 순서로 씁니다. 예: The task has high authenticity because its topic and discourse purpose resemble real-world communication.


📚 [Assessment] 개념 정리로 돌아가기 →