Standaard Boekhandel gebruikt cookies en gelijkaardige technologieën om de website goed te laten werken en je een betere surfervaring te bezorgen.
Hieronder kan je kiezen welke cookies je wilt inschakelen:
Technische en functionele cookies
Deze cookies zijn essentieel om de website goed te laten functioneren, en laten je toe om bijvoorbeeld in te loggen. Je kan deze cookies niet uitschakelen.
Analytische cookies
Deze cookies verzamelen anonieme informatie over het gebruik van onze website. Op die manier kunnen we de website beter afstemmen op de behoeften van de gebruikers.
Marketingcookies
Deze cookies delen je gedrag op onze website met externe partijen, zodat je op externe platformen relevantere advertenties van Standaard Boekhandel te zien krijgt.
Je kan maximaal 250 producten tegelijk aan je winkelmandje toevoegen. Verwijdere enkele producten uit je winkelmandje, of splits je bestelling op in meerdere bestellingen.
Die Erkundung und Nutzung großer Mengen von Textdokumenten ist eine wichtige Frage im Bereich Information Retrieval und Text Mining. Alle Methoden, die darauf abzielen, Gruppen von Entitäten zu finden, verwenden Ähnlichkeits- oder Unähnlichkeitsmaße. Es ist notwendig zu analysieren, wie sich Ähnlichkeitsmaße auf Textdokumenten verhalten, bevor ein gutes Ähnlichkeitsmaß für das Clustering von Dokumenten entwickelt oder modifiziert wird, um die Effektivität der Technik zu verstehen. Eine Ähnlichkeitsfunktion, die in eine Kriteriumsfunktion eingebettet ist, ist zu einem großen Teil dafür verantwortlich, die intrinsische Struktur der Daten zu analysieren. Wenn geeignete Ähnlichkeitsmaße mit einer bestimmten Clustering-Technik verwendet werden, kann die Effizienz und Genauigkeit der Informationsentdeckungsaufgabe verbessert werden. Die Verwendung geeigneter Maße verbessert nicht nur die Herkunft und Glaubwürdigkeit der abgerufenen Informationen, sondern hilft auch, die zeitliche und finanzielle Komplexität des Prozesses zu überwinden. Dieses Buch konzentriert sich auf die Identifizierung der verschiedenen Ähnlichkeitsmaße für das Clustering. Es wird eine zwingende Methode zur Messung der Ähnlichkeit zwischen Textdokumenten veranschaulicht, um die Dokumente mit Hilfe von hierarchischem Clustering und Feature-Selection-Methoden unter Verwendung von Matlab zu clustern.