Este o tehnică de extragere a datelor care transformă datele brute într-un format ușor de înțeles. Datele brute (datele din lumea reală) sunt întotdeauna incomplete și acele date nu pot fi trimise printr-un model. Asta ar provoca anumite erori. De aceea trebuie să preprocesăm datele înainte de trimiterea printr-un model
De ce trebuie să preprocesăm datele?
Este o tehnică de extragere a datelor care transformă datele brute într-un format ușor de înțeles Datele brute (date din lumea reală) sunt întotdeauna incomplete și acele date nu pot fi trimise printr-un model. Asta ar provoca anumite erori. De aceea trebuie să preprocesăm datele înainte de a le trimite printr-un model.
Ar trebui să preprocesez datele de testare?
Esența de bază a acestui lucru este: Nu ar trebui să utilizați o metodă de preprocesare care este potrivită pe întregul set de date, pentru a transforma datele de testare sau de tren. Dacă procedați astfel, transportați din greșeală informații de la garnitura de tren către setul de testare.
Ce este o problemă de scurgere de date?
Scurgerea de date este transmiterea neautorizată a datelor din interiorul unei organizații către o destinație sau un destinatar extern … Scurgerea de date, cunoscută și sub numele de furtul de date scăzut și lent, este o problemă uriașă pentru securitatea datelor, iar daunele cauzate oricărei organizații, indiferent de dimensiune sau industrie, pot fi grave.
Cum transformi datele de testare?
transform va transforma toate caracteristicile prin scăzând media și împărțind la varianța. Pentru comoditate, aceste două apeluri de funcții pot fi efectuate într-un singur pas folosind fit_transform.