Musterlösung zeitungsartikel

Sharing is caring!

ngrams Säcke mit Wörtern werden traditionell erfolgreich für Klassifizierungsaufgaben in NLP verwendet, daher haben wir Säcke mit Wörtern (Lemmas) in die Kandidatenphrasen als eines unserer Merkmale aufgenommen (und sie später als Basislinie behandeln). Wir schließen auch Bigrams und Trigramme ein, da Multi-Wort-Kombinationen auf Probleme und Lösungen hinweisen können, z.B. “kombinatorische Explosion”. Anstelle eines keywordbasierten Ansatzes verwendete Charles (2011) Diskursmarker, um zu untersuchen, wie das Problemlösungsmuster im Text signalisiert wurde. Insbesondere untersuchten sie, wie Adverbiale, die mit einem Ergebnis wie “also also also”” verbunden sind, verwendet werden, um ein Problemlösungsmuster zu signalisieren. Es wäre attraktiv, Problem- und Lösungsanweisungen automatisch im Text zu erkennen. Dies gilt sowohl aus theoretischer als auch aus praktischer Sicht. Theoretisch wissen wir, dass die Stimmungserkennung mit Problemlösungsaktivitäten zusammenhängt, weil wir den Eindruck haben, dass “schlechte” Situationen durch Problemlösung in “bessere” situationen. Der genaue Mechanismus, wie dies erkannt werden kann, würde den Stand der Technik im Textverständnis voranbringen. In Bezug auf die sprachliche Umsetzung, Problem- und Lösungsaussagen kommen in vielen Varianten und Neuformulierungen, oft in Form von positiven oder negierten Aussagen über die Bedingungen, Ergebnisse und Ursachen von Problem-Lösungspaaren. Diese zu erkennen und zu interpretieren, würde uns eine einigermaßen objektive Art und Weise geben, die Fähigkeit eines Systems zu testen. In der Praxis ist die Möglichkeit, jede Erwähnung eines Problems zu erkennen, ein erster Schritt zur Erkennung des spezifischen Forschungsziels eines Papiers.

Dies zu erreichen, ist seit einiger Zeit ein Ziel für den wissenschaftlichen Informationsabruf, und wenn es erfolgreich ist, würde es die Wirksamkeit der wissenschaftlichen Suche immens verbessern. Das Erkennen von Problem- und Lösungsaussagen von Papieren würde es uns auch ermöglichen, ähnliche Papiere zu vergleichen und schließlich sogar zur automatischen Generierung von Review-Artikeln in einem Feld zu führen. Die Ergebnisse für die Unklarheit von Lösungen aus Nichtlösungen sind in Tabelle 8 zu sehen. Die Baseline der Bag-of-Words-Baseline schneidet viel besser ab als zufällig, wobei die Leistung im Hinblick auf den SVM recht hoch ist (dieses Ergebnis war auch höher als alle Basisleistungen der Problemklassifikatoren). Wie in Tabelle 9 dargestellt, umfassten die am besten bewerteten Lemmas des leistungsstärksten Modells (mit Hilfe von Informationsgewinnen) “Use” und “Method”. Diese Lemmas sind sehr indikativ für die Lösungund geben so einen Einblick in die hohe Ausgangsbasis von den Maschinenlernern zurückgegeben. Die Subkategorisierung und die Ergebnisadverbien waren die beiden am schlechtesten abschneidenden Merkmale. Die geringe Leistung bei der Subkategorisierung ist jedoch auf die Stichprobenerhebung der Nichtlösungen zurückzuführen (derselbe Grund für die geringe Leistung der problematischen Transitivitätsfunktion).

This entry was posted in Uncategorized. Bookmark the permalink.