211service.com
Akademische Suchmaschine greift nach Bedeutung
Wenn Computern beigebracht werden kann, in den Tausenden von Forschungsarbeiten, die jedes Jahr veröffentlicht werden, eine Bedeutung zu finden, dann könnten sie vielleicht automatisch wichtige neue Trends oder Entdeckungen hervorheben und Schlussfolgerungen daraus ziehen.
Der Allen Institut für Künstliche Intelligenz arbeitet auf genau dieses Ziel hin und hat ein neues Tool namens entwickelt Semantischer Gelehrter das Millionen von Informatikarbeiten durchsuchen kann. Das heute eingeführte Tool bietet Möglichkeiten zur Verfeinerung der Suche auf der Grundlage von Informationen, die aus dem Text von Papieren extrahiert wurden.
Es ist beispielsweise möglich, die Suche nach der Zeitschrift einzugrenzen, in der ein Beitrag veröffentlicht wurde, auf der Konferenz, auf der er präsentiert wurde, oder nach dem verwendeten Datensatz. Der semantische Gelehrte zeigt auch Schlüsselphrasen in einem Papier.
Darunter gibt es bereits viele akademische Suchmaschinen Google Scholar , Microsoft Academic Search , PubMed , und JSTOR . Diese durchsuchen die Aufsätze jedoch in der Regel nur anhand von Schlüsselwörtern und anderen eindeutig kategorisierten Informationen wie dem Veröffentlichungsdatum.
Oren Etzioni , Executive Director des Allen Institute, sagt, dass viele relevante Informationen in Forschungsarbeiten auf unterschiedliche Weise präsentiert werden. Die Software hinter Semantic Scholar wurde darauf trainiert, verschiedene Konzepte mit einer Vielzahl von maschinellen Lerntechniken zu extrahieren. Mit Millionen von Zeitungen, die jedes Jahr erscheinen, kann man einfach nicht mithalten, sagt Etzioni. Sie brauchen also ein gewisses Maß an Verständnis.
Es besteht ein wachsendes Interesse daran, maschinelles Lernen einzusetzen, um Computer darauf zu trainieren, bestimmte Konzepte in Daten zu erkennen. Google erstellt einen sogenannten Knowledge Graph aus Konzepten, indem es Algorithmen trainiert, das Web zu crawlen und nützliche Informationen zu extrahieren. Aus diesem Grund zeigt Google bei der Suche nach Wie alt ist Barack Obama nicht nur Webseiten an, die diese Informationen enthalten können, sondern teilt Ihnen auch direkt mit, dass er 54 Jahre alt ist.
Ähnliches versuchen andere Unternehmen mit wissenschaftlichen Arbeiten. Eine Firma hat angerufen Meta kündigte heute auch einen Dienst an, der die in der medizinischen Literatur erwähnten Personen und Organisationen automatisch identifiziert. Meta nutzt die von SRI im Rahmen eines Projekts namens FUSE entwickelte Technologie, um mithilfe von maschinellem Lernen wissenschaftliche Trends vorherzusagen.
Sam Molyneux, CEO von Meta, sagt, dass der Dienst, der später in dieser Woche live geht, einem Benutzer Papiere empfehlen kann, die auf den Konzepten in einem Papier basieren, das sie zuvor gelesen haben, und sogar aufkommende Technologien automatisch identifizieren kann. Im Wesentlichen ermöglicht es Ihnen, auf Konzeptebene oder Technologieebene zu verfolgen, anstatt auf Artikelebene, sagt Molyneux. Konzepte wie die CRISPR-Technologie, die die Genomtechnik derzeit wirklich revolutioniert, haben wir vor einigen Jahren als aufkommendes Konzept aufgegriffen.
Etzioni sagt, das Ziel von Semantic Scholar sei es, noch weiter zu gehen, indem Computern ein viel tieferes Verständnis neuer wissenschaftlicher Veröffentlichungen vermittelt wird. Sein Team entwickelt Algorithmen, die Grafiken oder Diagramme in Papieren lesen und versuchen, die darin enthaltenen Werte zu extrahieren. Wir wollen letztendlich in der Lage sein, eine experimentelle Arbeit zu nehmen und zu sagen: „Okay, muss ich diese Arbeit lesen, oder kann mir der Computer sagen, dass diese Arbeit gezeigt hat, dass dieses bestimmte Medikament hochwirksam war?“