• Afhalen na 1 uur in een winkel met voorraad
  • Gratis thuislevering in België vanaf € 30
  • Ruim aanbod met 7 miljoen producten
  • Afhalen na 1 uur in een winkel met voorraad
  • Gratis thuislevering in België vanaf € 30
  • Ruim aanbod met 7 miljoen producten
€ 26,45
+ 52 punten
Levertermijn 1 à 4 weken
Eenvoudig bestellen
Veilig betalen
Gratis thuislevering vanaf € 30 (via bpost)
Gratis levering in je Standaard Boekhandel

Omschrijving

Data warehouses consolidate various activities of a business and often form the backbone for generating reports that support important business decisions. Errors in data tend to creep in for a variety of reasons. Some of these reasons include errors during input data collection and errors while merging data collected independently across different databases. These errors in data warehouses often result in erroneous upstream reports, and could impact business decisions negatively. Therefore, one of the critical challenges while maintaining large data warehouses is that of ensuring the quality of data in the data warehouse remains high. The process of maintaining high data quality is commonly referred to as data cleaning. In this book, we first discuss the goals of data cleaning. Often, the goals of data cleaning are not well defined and could mean different solutions in different scenarios. Toward clarifying these goals, we abstract out a common set of data cleaning tasks that often need to be addressed. This abstraction allows us to develop solutions for these common data cleaning tasks. We then discuss a few popular approaches for developing such solutions. In particular, we focus on an operator-centric approach for developing a data cleaning platform. The operator-centric approach involves the development of customizable operators that could be used as building blocks for developing common solutions. This is similar to the approach of relational algebra for query processing. The basic set of operators can be put together to build complex queries. Finally, we discuss the development of custom scripts which leverage the basic data cleaning operators along with relational operators to implement effective solutions for data cleaning tasks.

Specificaties

Betrokkenen

Auteur(s):
Uitgeverij:

Inhoud

Aantal bladzijden:
69
Taal:
Engels
Reeks:

Eigenschappen

Productcode (EAN):
9783031007699
Verschijningsdatum:
1/10/2013
Uitvoering:
Paperback
Bestandsformaat:
Trade paperback (VS)
Afmetingen:
190 mm x 235 mm
Gewicht:
167 g
Standaard Boekhandel

Alleen bij Standaard Boekhandel

+ 52 punten op je klantenkaart van Standaard Boekhandel
MUST-HAVES

Hier bloeit iets

Nu dubbele punten op onze selectie nieuwe titels
MUST-HAVES
Hier bloeit iets
AANGERADEN

Onze cadeautips

voor Vaderdag
AANGERADEN
Onze cadeautips voor Vaderdag
VADERDAG ACTIE

Alleen in onze winkels: kortingsbon van € 10 voor e-books

bij een Vivlio e-reader
VADERDAG ACTIE
Vivlio e-reader + € 10 aan e-books
Standaard Boekhandel

Beoordelingen

We publiceren alleen reviews die voldoen aan de voorwaarden voor reviews. Bekijk onze voorwaarden voor reviews.