news.furt.at

Wenn du angemeldet bist, kannst du Artikel speichern und unser Algorithmus versucht aus der riesigen Flut an Artikeln heraus zu filtern was dich noch interessieren könnte.







Neuer Benutzer
Passwort vergessen

Algorithmus

Alle 15 Minuten holen wir uns von österreichischen Medien ihre aktuellen Inhalte. Großteils über RSS-Feeds, aber auch per Volltextsuche.

Danach versuchen wir aus den geholten Inhalten den tatsächlichen Artikel-Text herauszufiltern und diesen Text bereinigen wir dann um sogenannte „Stopwords“. Das sind alle Wörter, die zu häufig vorkommen und beim Vergleichen der Inhalte keine oder kaum Aussagekraft besitzen (ein, eine, einer, der, die, das, werden, wird, geworden usw.). Was uns davon übrig bleibt sind dann Signalworte, diese werden unter den Artikeln auch angezeigt, und damit arbeitet dann unser Algorithmus.

Jedesmal wenn du einen Artikel aufrufst, protokollieren wir das mit. Alle Signalworte die dieser Artikel hat, wandern dann in deinen Fundus. Das ist einfach eine Liste von Wörtern mit Punkten. Je mehr Punkte ein Wort hat, umso öfter kam es in Artikeln vor die du angesehen oder gespeichert hast.

Kommen neue Artikel, in denen Signalwörter stecken, die bei dir eine hohe Punktzahl haben, gehen wir davon aus, dass dieser Artikel für dich von höherem Interesse ist, er hat für dich hohe Relevanz.

Außerdem betrachten wir Inhalte die in der Nähe deiner Postleitzahl verortet werden können ebenfalls als für dich mehr Relevant. Wenn du aber zum Beispiel viel in Wien bist, obwohl du dort nicht wohnst, und oft Artikel aus und über Wien aufrufst, wird das Signalwort Wien bei dir immer stärker und so landen auch diese Artikel in deinem Relevanz-Cluster.

Punktevergabe:

Ursprung Punkte
Signalwörter aus jedem aufgerufenem Artikel 1
Signalwörter aus gespeichertem Artikel 5

Zukunftsideen

  • Mitspeichern wann ein Signalwort dazukam, in Epochen (10 Tage?) einteilen. Je länger ein Wert zurückliegt umso weniger zählt er (Punkte verblassen). Statt Zeiträumen eventuell die zuletzt aufgerufenen Links in Paketen bündeln?
  • Den Leuten ihren Fundus anzeigen und sie Wörter blockieren lassen (könnte auch Schwarm-Intelligenz für uns sein, indem wir häufig blockierte Wörter zu den Stopwords hinzufügen)
  • Verhindern der Bubble, also dass die Punkte sich um wenige Singalworte so hochschaukeln, dass kaum mehr etwas anderes relevant erscheint. Dürfte nur über verwandte Signalworte möglich sein.