Wenn künstliche Intelligenz medizinische Prüfungs- und Versorgungslogiken herausfordert

Authors

  • Thomas Gönner Universitätsklinikum Wien

DOI:

https://doi.org/10.60733/PMGR.2026.02

Keywords:

Künstliche Intelligenz, Medizinische Ausbildung, Staatsexamina, Klinische EntEntscheidungsunterstützung, Gesundheitsgovernance

Abstract

Große Sprachmodelle wie Google Gemini erreichen zunehmend Leistungsniveaus, die klassische Wissensprüfungen in der medizinischen Ausbildung infrage stellen. Während bisherige Studien vor allem internationale oder englischsprachige Prüfungsformate analysierten, fehlten belastbare empirische Befunde für den deutschsprachigen Raum. Dieser Artikel untersucht erstmals systematisch die Leistungsfähigkeit von Google Gemini anhand von 1.252 originalen Prüfungsfragen des Instituts für medizinische und pharmazeutische Prüfungsfragen (IMPP). Die Ergebnisse zeigen eine Gesamt-Trefferquote von 96 Prozent und damit eine deutliche Überschreitung der üblichen Bestehensgrenze. Der Beitrag interpretiert diese Befunde nicht als unmittelbaren Reformdruck für Prüfungsordnungen, sondern als Anlass zur Reflexion bestehender Prüfungs-, Ausbildungs- und Versorgungslogiken. Im Fokus stehen Governance-, Steuerungs- und Gestaltungsfragen für Entscheidungsträger, Gesundheitspolitik und klinischer Praxis. Abschließend werden Handlungsempfehlungen formuliert.

References

[1] Sallam M. ChatGPT Utility in Healthcare Education, Research, and Practice: Systematic Review on the Promising Perspectives and Valid Concerns. Healthcare (Basel). 2023 Mar 19;11(6):887. doi: 10.3390/healthcare11060887. PMID: 36981544; PMCID: PMC10048148.

[2] Eysenbach G. The Role of ChatGPT, Generative Language Models, and Artificial Intelligence in Medical Education: A Conversation With ChatGPT and a Call for Papers. JMIR Med Educ. 2023 Mar 6;9:e46885. doi: 10.2196/46885. PMID: 36863937; PMCID: PMC10028514.

[3] Lee H. The rise of ChatGPT: Exploring its potential in medical education. Anat Sci Educ. 2024 Jul-Aug;17(5):926-931. doi: 10.1002/ase.2270. Epub 2023 Mar 28. Erratum in: Anat Sci Educ. 2024 Dec;17(9):1779. doi: 10.1002/ase.2496. PMID: 36916887

[4] Shah NH, Entwistle D, Pfeffer MA. Creation and Adoption of Large Language Models in Medicine. JAMA. 2023 Sep 5;330(9):866-869. doi: 10.1001/jama.2023.14217. PMID: 37548965.

[5] Jung, Leonard B. and Gudera, Jonas A. and Wiegand, Tim L. T. and Allmendinger, Simeon and Dimitriadis, Konstantinos and Koerte, Inga K. ChatGPT Passes German State Examination in Medicine With Picture Questions Omitted. Dtsch Arztebl International, vol. 120, no. 21-22, pp. 373–374, 2023, doi: 10.3238/arztebl.m2023.0113.

[6] Meyer A, Riese J, Streichert T. Comparison of the Performance of GPT-3.5 and GPT-4 With That of Medical Students on the Written German Medical Licensing Examination: Observational Study. JMIR Med Educ. 2024 Feb 8;10:e50965. doi: 10.2196/50965. PMID: 38329802; PMCID: PMC10884900.

[7] Bundesministerium für Gesundheit, “Approbationsordnung für Ärzte (ÄApprO 2002), §14 Abs. 6”.

[8] Institut für medizinische und pharmazeutische Prüfungsfragen (IMPP), “Bestehens- und Notengrenzen.”. Available: https://www.impp.de/pruefungen/allgemein/bestehens-und-notengrenzen.html. [Accessed: Mar. 14, 2026]

[9] Mihalache A, Grad J, Patil NS, et al. Google Gemini and Bard artificial intelligence chatbot performance in ophthalmology knowledge assessment. Eye (London, England). 2024 Sep;38(13):2530-2535. DOI: 10.1038/s41433-024-03067-4. PMID: 38615098; PMCID: PMC11383935.

[10] Homolak J. Opportunities and risks of ChatGPT in medicine, science, and academic publishing: a modern Promethean dilemma. Croat Med J. 2023 Feb 28;64(1):1-3. doi: 10.3325/cmj.2023.64.1. PMID: 36864812; PMCID: PMC10028563.

Downloads

Published

2026-06-10

Issue

Section

From the Classroom

Categories