Neues KI-gesteuertes Discovery-Erlebnis – Feedly Blog

Wir lieben das Web, weil es ein offenes und verteiltes Netzwerk ist, das jedem die Freiheit und Kontrolle bietet, das zu veröffentlichen und zu verfolgen, was ihm wichtig ist.

Wir lieben das Web auch, weil es eine neue Generation von Content-Erstellern ermöglicht hat (Ben Thompson, Bruce Schneier, Tina Eisenberg, Seth Godin, Maria Popova, etc.). Diese unabhängigen Denker erkunden kontinuierlich den Rand des Bekannten und teilen aufschlussreiche und inspirierende Ideen mit ihren Gemeinschaften.

Menschen mit den besten Quellen für die Themen zu verbinden, die ihnen wichtig sind, ist seit den Anfängen von Feedly ein Kern unserer Mission.

Aber die Entdeckung ist ein schwieriges Problem. Das Web ist organisch und spiegelt die sich ändernden Bedürfnisse und Prioritäten der Weltgemeinschaft wider. Es gibt Millionen von Quellen zu Tausenden von Themen und wir alle haben einen anderen Appetit, wenn es darum geht, unseren Geist zu ernähren.

Vor etwa zwölf Monaten haben wir ein Team für maschinelles Lernen gegründet, um zu sehen, ob uns die neuesten Fortschritte beim Deep Learning und der Verarbeitung natürlicher Sprache helfen könnten, diese Nuss zu knacken.

Heute freuen wir uns, Ihnen mit der Veröffentlichung des neuen Entdeckungserlebnisses in der Feedly Lab-App (Experience 06) eine Vorschau auf das Ergebnis dieser Arbeit zu geben.

Zweitausend Themen

Die erste Herausforderung bei der Entdeckung besteht darin, eine Taxonomie von Themen zu erstellen.

Sie können sich Feedly als ein reichhaltiges Diagramm mit Personen, Themen und Quellen vorstellen. Um die richtige Taxonomie zu erstellen, haben wir mit den Rohdaten aller Feedly-Quellen begonnen. Wir mussten ein Modell erstellen, um diese Daten zu bereinigen, anzureichern und in einer Hierarchie von Themen zu organisieren. Erfahren Sie mehr über die Data Science dahinter.

Das Ergebnis ist ein reichhaltiges, vernetztes Netzwerk mit zweitausend englischen Themen. Und es ist gut mit der Art und Weise abgebildet, wie Menschen das Web erkunden und lesen.

Einige Themen sind breit gefächert: Technik, Sicherheit, Entwurf, Marketing. Einige sind sehr nischenhaft: erweiterte Realität, Malware, Typografie, oder SEO.

Auf der Discovery-Homepage präsentieren wir dreißig Themen basierend auf beliebten Branchen, Trends, Fähigkeiten oder Leidenschaften. Über das Suchfeld können Sie auf alle Themen in Feedly zugreifen.

Die fünfzig interessantesten Quellen

Die zweite Herausforderung besteht darin, die fünfzig interessantesten Quellen zu finden, denen jemand folgen möchte, der zu einem bestimmten Thema recherchiert.

Das Ranking von Quellen ist schwierig, da nicht alle Quellen gleich sind. In der Technik zum Beispiel gibt es Mainstream-Publikationen wie The Verge oder TechCrunch, Expertenstimmen wie Ben Thompson und viele laute B-Listenquellen, die keinen großen Mehrwert bieten.

Darüber hinaus sind einige Quellen für Nischenthemen wie Virtual Reality spezifisch für VR, während andere eine Reihe verwandter Themen abdecken.

Um diese Herausforderung zu lösen, haben wir ein Modell erstellt, das Quellen durch drei verschiedene Linsen betrachtet:

  • Followerzahl
  • Relevanz (wie fokussiert ist die Quelle auf das gegebene Thema)
  • Engagement (ein Proxy für Qualität und Aufmerksamkeit)

Das Ergebnis sind neue Suchergebniskarten. Sie können die fünfzig interessantesten Quellen zu einem bestimmten Thema durchsuchen und nach der für Sie wichtigsten Linse sortieren.

Nachbarschaften

Einer der Vorteile des neuen Themenmodells besteht darin, dass die 2.000 Themen hierarchisch organisiert sind. Auf diese Weise können Sie ganz einfach hinein- oder herauszoomen und viele verschiedene Bereiche des Webs erkunden.

Vom Thema Cybersicherheit aus können Sie beispielsweise zu einer Liste verwandter Themen springen, die Ihnen einen tieferen Einblick in Malware, Forensik oder Datenschutz ermöglichen.

Eine Sache noch…

Wir haben in den letzten vier Jahren viel recherchiert, um zu verstehen, wie Menschen neue Quellen entdecken. Eine Erkenntnis, die wir gelernt haben, ist, dass Menschen bestimmte Quellen oft mitlesen. Wenn Sie sich beispielsweise für Kunst, Design und Popkultur interessieren und Fubiz folgen, besteht eine hohe Chance, dass Sie auch Designboom folgen.

Vor diesem Hintergrund haben wir einige Zeit damit verbracht, ein Modell zu erstellen, das lernt, welche Quellen häufig mitgelesen werden. Die Idee ist, dass ein Benutzer eine Quelle eingeben kann, die er liebt, und eine andere Quelle entdecken, mit der er sie koppeln kann.

Sie können mehr über das Modell des maschinellen Lernens (wir nennen es feed2vec) erfahren, das diese Erfahrung ermöglicht der Artikel, den Paul hier veröffentlicht hat.

Als Benutzer können Sie auf diese Funktion zugreifen, indem Sie auf der Entdeckungsseite nach einer Quelle suchen, die Sie gerne lesen. Das Ergebnis ist eine Liste von Quellen, die oft mit dieser Quelle gemeinsam gelesen werden.

Dankeschön!

Ich möchte Paul, Michelle, Mathieu und Aymeric für die großartige Forschungsarbeit danken, die sie geleistet haben, um dieses Projekt von Null auf Eins zu bringen. Menschen, die versucht haben, Entdeckungen in Angriff zu nehmen, wissen, dass dies eine sehr schwere Herausforderung ist und die Ergebnisse dieses Projekts sehr beeindruckend waren.

Wir möchten uns auch bei der Community für die Teilnahme am Battle of the Sources-Experiment bedanken. Ihr Beitrag war entscheidend dafür, dass wir lernen, das Quellenranking zu modellieren. Wir werden weiterhin in Entdeckungen investieren und freuen uns auf die weitere Zusammenarbeit mit Ihnen.

Wir möchten auch Dan Newman, Daron Brewood, Enrico, Joey, Lior, Paul Adams, Ryan Murphy und Joseph Thornley vom Labor für die Durchsicht einer früheren Version dieses Artikels danken.

Add a Comment

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.