Der t-Test von Welch, benannt nach seinem Schöpfer Bernard Lewis Welch, ist eine Adaption des Student t-Tests. Im Gegensatz zum Student t-Test geht er nicht von einer gleichen Varianz in den beiden Populationen aus (Welch 1947). Er basiert ebenfalls auf Hypothesentests, wie der Chi-Quadrat-Test und der Log-Likelihood-Ratio-Test, berücksichtigt aber im Gegensatz zu ihnen nicht nur die Häufigkeit eines Merkmals. Stichprobenmittelwert, Standardabweichung und Stichprobengröße fließen in die Berechnung des t-Wertes ebenso ein. Aus diesem Grund kann dieses Maß besser mit häufigen Wörtern umgehen, die nur in einem Text oder einem Teil eines Textes in einer bestimmten Sammlung vorkommen.

Bibliografie

Paquot, Magali, and Yves Bestgen, ‘Distinctive Words in Academic Writing: A Comparison of Three Statistical Tests for Keyword Extraction’, in Corpora: Pragmatics and Discourse, ed. by Andreas H. Jucker, Daniel Schreier, and Marianne Hundt (Brill | Rodopi, 2009), doi:10.1163/9789042029101_014
Smucker, Mark D., James Allan, and Ben Carterette, ‘A Comparison of Statistical Significance Tests for Information Retrieval Evaluation’, in Proceedings of the Sixteenth ACM Conference on Conference on Information and Knowledge Management, CIKM ’07 (ACM, 2007), pp. 623–32, http://doi.org/10.1145/1321440.1321528
Welch, Bernard Lewis, ‘The Generalization of Student’s Problem When Several Different Population Variances Are Involved’, Biometrika, 34.1–2 (1947), pp. 28–35, http://doi.org/10.1093/biomet/34.1-2.28