Wissenschaftliche texte downloaden

Die CLARIN ERIC-Infrastruktur ermöglicht den Zugang zu 22 Korpora akademischer Texte, von denen 2 mehrsprachig und 20 einsprachig sind. Die verfügbaren Korpora enthalten wissenschaftliche Texte in den folgenden 11 Sprachen: Tschechisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Griechisch, Russisch, Slowenisch, Spanisch und Schwedisch. Mehr als 15 verschiedene wissenschaftliche Disziplinen sind vertreten, wobei die wichtigsten Linguistik, Informatik, Wirtschaftswissenschaften und Medizin sind. Der Großteil der Korpora reich markiert und sind in öffentlichen Lizenzen erhältlich. Um die zweite Hypothese zu testen, haben wir ein Maß für das wissenschaftliche Vokabular in der Gruppe konstruiert. Wir wählten die 2.949 häufigsten Wörter aus, die nicht in der gemeinsamen NDC-Wortliste enthalten waren, aus 12.000 nach dem Zufallsprinzip abgetasteten Abstracts (siehe Materialien und Verfahrensmethoden). Dies entspricht einer “wissenschaftsspezifischen gemeinsamen Wortliste”. Diese Liste enthält auch Themen, die im Laufe der Zeit zugenommen haben (z. B. “Gen”) und fachspezifische Wörter (z.

B. “Tumor”), die nicht auf ein gruppenübergreifendes wissenschaftliches Vokabular hinweisen. Wir haben solche Wörter entfernt, um eine allgemeine wissenschaftliche Jargonliste zu erstellen (2.138 Wörter; siehe Materialien und Methoden und Ergänzende Datei 2). Während der Prozentsatz der gemeinsamen Wörter aus der NDC-Liste der gebräuchliche Wörter mit dem Jahr abnahm (r = 0,93 USD, 95 % CI [-0,93, -0,93], P 10-15, Abbildung 6A), gab es einen Anstieg des Prozentsatzes der wissenschaftlich-spezifischen gemeinsamen Wörter (r = 0,90, 95% CI [0,90, 0,91], P 10-15) und des allgemeinen wissenschaftlichen Jargons (r = 0,96, 95% CI [0,95, 0,96], p 10-15) (Abbildung 6A). Zwölf allgemeine wissenschaftliche Jargonwörter sind in Abbildung 6B dargestellt. Während ein Wort (“erscheint”) mit der Zeit abnahm, zeigen alle übrigen Beispiele im Laufe der Zeit starke Zuwächse. Zusammengenommen liefert dies Beweise für die Hypothese, dass es eine Zunahme des allgemeinen wissenschaftlichen Jargons gibt, der teilweise für die abnehmende Lesbarkeit verantwortlich ist. Was kann noch getan werden, um diesen Trend umzukehren? Das aufstrebende Feld der Wissenschaftskommunikation beschäftigt sich mit Möglichkeiten, wie Wissenschaft Ideen effektiv einem breiteren Publikum vermitteln kann (Treise und Weigold, 2002; Nielsen, 2013; Fischhoff, 2013).

Ein Vorschlag aus diesem Bereich ist die Schaffung zugänglicher “Laienzusammenfassungen”, die von einigen Zeitschriften umgesetzt wurden (Kuehne und Olden, 2015). Andere haben festgestellt, dass Wissenschaftler ihre direkte Kommunikation mit der breiten Öffentlichkeit über soziale Medien verstärken (Peters et al., 2014), und dieser Trend könnte gefördert werden. Obwohl diese beiden Vorschläge die Zugänglichkeit wissenschaftlicher Ergebnisse verbessern können, wird keiner der beiden den Lesbarkeitstrend wissenschaftlicher Texte umkehren. Ein weiterer Vorschlag ist, die wissenschaftliche Kommunikation zu einem notwendigen Bestandteil der Bachelor- und Graduiertenausbildung zu machen (Brownell et al., 2013).