Nepareizi uzrakstīti vārdi, aizkaujas atstarpes, nevēlami priedēkļi, nepareizi gadījumi un nedrukājamas rakstzīmes rada sliktu pirmo iespaidu. Un tas nav pat pilnīgs saraksts ar veidiem, kā jūsu dati var tikt netīri. Apvelciet apvākņus. Ir pienācis laiks pēc pavasara darblapu tīrīšanas programmā Microsoft Excel.
Ne vienmēr varat kontrolēt no ārēja datu avota importēto datu formātu un tipu, piemēram, datu bāzi, teksta failu vai tīmekļa lapu. Pirms datu analizēšanas tie bieži ir jātīra. Par laimi programmā Excel ir daudz līdzekļu, kas palīdz iegūt datus vajadzīgajās precīzajās formātās. Dažreiz uzdevums ir vienkāršs, un ir konkrēts līdzeklis, kas šo uzdevumu veicē jūsu virzienā. Piemēram, varat viegli izmantot pareizrakstības pārbaudītāju, lai iztīrītu kļūdaini uzrakstītos vārdus kolonnās, kurās ir komentāri vai apraksti. Ja vēlaties noņemt rindu dublikātus, varat to ātri izdarīt, izmantojot dialoglodziņu Dublikātu noņemšana.
Citos gadījumos var būt nepieciešams manipulēt ar vienu vai vairākām kolonnām, izmantojot formulu, lai pārvērstu importētās vērtības par jaunām vērtībām. Piemēram, ja vēlaties noņemt beigu atstarpes, varat izveidot jaunu kolonnu, lai notīrītu datus, izmantojot formulu, aizpildot jauno kolonnu uz leju, konvertējot jaunās kolonnas formulas par vērtībām un pēc tam noņemot sākotnējo kolonnu.
Pamatdarbības datu tīrīšanai ir šādas:
-
Importējiet datus no ārēja datu avota.
-
Izveidojiet sākotnējo datu dublējumkopiju atsevišķā darbgrāmatā.
-
Pārliecinieties, vai dati ir tabulas formātā, kas attiecas uz rindām un kolonnām: līdzīgi dati katrā kolonnā, visas kolonnas un rindas redzamas un diapazonā nav tukšu rindu. Lai iegūtu vislabākos rezultātus, izmantojiet Excel tabulu.
-
Veiciet uzdevumus, kuriem nav nepieciešama kolonnu manipulācija, piemēram, pareizrakstības pārbaudi vai dialoglodziņa Atrašana un aizstāšana izmantošana.
-
Pēc tam veiciet uzdevumus, kam nepieciešama kolonnas manipulācija. Lai veiktu manipulācijas ar kolonnu, ir šādas vispārīgās darbības:
-
Ievietojiet jaunu kolonnu (B) blakus sākotnējai kolonnai (A), kas ir jātītī.
-
Pievienojiet formulu, kas pārveidos datus jaunās kolonnas augšdaļā (B).
-
Aizpildiet formulu jaunajā kolonnā (B). Excel tabulā aprēķinātā kolonna tiek automātiski izveidota ar uz leju aizpildītām vērtībām.
-
Atlasiet jauno kolonnu (B), kopējiet to un ielīmējiet kā vērtības jaunajā kolonnā (B).
-
Noņemiet sākotnējo kolonnu (A), pārvēršot jauno kolonnu no B par A.
-
Lai periodiski notīrītu vienu datu avotu, apsveriet iespēju ierakstīt makro vai rakstīt kodu, lai automatizētu visu procesu. Pastāv arī vairākas ārējas pievienojumprogrammas, ko uzrakstījuši trešo pušu piegādātāji un kas norādītas sadaļā Trešo pušu pakalpojumu sniedzēji, ja jums nav laika vai resursu, lai automatizētu šo procesu pats.
Papildinformācija |
Apraksts |
---|---|
Parāda, kā izmantot komandu Aizpildījums . |
|
Tabulu izveide un formatēšana Tabulas izmēru maiņa, pievienojot vai noņemot rindas un kolonnas Aprēķināto kolonnu izmantošana Excel tabulā |
Parādīts, kā izveidot Excel tabulu un pievienot vai dzēst kolonnas vai aprēķinātās kolonnas. |
Parāda vairākus veidus, kā automatizēt atkārtotas darbības uzdevumus, izmantojot makro. |
Varat izmantot pareizrakstības pārbaudītāju, lai atrastu ne tikai kļūdaini uzrakstītus vārdus, bet arī atrastu vērtības, kas nav konsekventi izmantotas, piemēram, produktu vai uzņēmumu nosaukumus, pievienojot šīs vērtības pielāgotai vārdnīcai.
Papildinformācija |
Apraksts |
---|---|
Parādīts, kā koriģēt kļūdaini uzrakstītus vārdus darblapā. |
|
Pielāgotu vārdnīcu izmantošana vārdu pievienošanai pareizrakstības pārbaudītājam |
Izskaidrots, kā izmantot pielāgotas vārdnīcas. |
Rindu dublikāti ir bieži sastopama problēma, importējot datus. Ir ieteicams vispirms filtrēt unikālās vērtības, lai pārliecinātos, vai rezultāti ir tieši tie, ko vēlaties, pirms noņemat dublētās vērtības.
Papildinformācija |
Apraksts |
---|---|
Parāda divas cieši saistītas procedūras: kā filtrēt unikālas rindas un kā noņemt rindu dublikātus. |
Iespējams, vēlēsities noņemt kopēju sākuma virkni, piemēram, etiķeti, kam seko kols un atstarpe, vai sufiksu, piemēram, iekavas frāzi novecojuša vai nevajadzīga virknes beigās. To var izdarīt, atrodot šī teksta instances un pēc tam aizstājot to bez teksta vai cita teksta.
Papildinformācija |
Apraksts |
---|---|
Pārbaudiet, vai šūnā ir teksts (reģistrnejutīgs) Pārbaude, vai šūnā ir teksts (reģistrjutīga informācija) |
Uzziniet, kā teksta atrašanai izmantot komandu Atrast un vairākas funkcijas. |
Parādīts, kā izmantot komandu Aizstāt un vairākas funkcijas, lai noņemtu tekstu. |
|
Rādīt, kā izmantot dialoglodziņu Atrašanaun aizstāšana. |
|
FIND, FINDB SEARCH, SEARCHB REPLACE, REPLACEB AIZSTĀT LEFT, LEFTB RIGHT, RIGHTB LEN, LENB MID, MIDB |
Šīs ir funkcijas, kuras varat izmantot, lai veiktu dažādus virkņu manipulācijas uzdevumus, piemēram, atrastu un aizstātu apakšvirti virknē, izvilktu virknes daļas vai noteiktu virknes garumu. |
Dažreiz teksts nāk jauktā maisā, īpaši, ja uztrauc teksta burtu reģistrs. Izmantojot vienu vai vairākas no trim reģistra funkcijām, tekstu varat pārvērst par mazajiem burtiem, piemēram, e-pasta adresēm, lielajiem burtiem, piemēram, produktu kodiem vai īpašvārdu reģistru, piemēram, vārdiem vai grāmatu nosaukumiem.
Papildinformācija |
Apraksts |
---|---|
Parāda, kā izmantot trīs funkcijas Case. |
|
Visus lielos burtus teksta virknē konvertē par mazajiem burtiem. |
|
Lieto lielo burtu pirmajam burtam teksta virknē un visiem citiem tekstā esošiem burtiem, kuri seko kādai rakstzīmei, kas nav burts. Pārvērš visus pārējos burtus par mazajiem burtiem. |
|
Pārvērš tekstu lielajiem burtiem. |
Dažreiz teksta vērtībās ir sākuma, beigu vai vairākas iegultas atstarpes rakstzīmes (Unicode rakstzīmju kopas vērtības 32 un 160) vai nedrukājamas rakstzīmes (unikoda rakstzīmju kopas vērtības no 0 līdz 31, 127, 129, 141, 143, 144 un 157). Šīs rakstzīmes dažreiz var izraisīt neparedzētus rezultātus, kārtojot, filtrējot vai meklējot. Piemēram, ārējā datu avotā lietotāji var radīt tipogrāfiskas kļūdas, nejauši pievienojot papildu atstarpes rakstzīmes, vai importēti teksta dati no ārējiem avotiem var ietvert nedrukājamas rakstzīmes, kas ir iegultas tekstā. Tā kā šīs rakstzīmes nav viegli pamanītas, neparedzēti rezultāti var būt grūti saprotami. Lai noņemtu šīs nevēlamās rakstzīmes, varat izmantot funkciju TRIM, CLEAN un SUBSTITUTE kombināciju.
Papildinformācija |
Apraksts |
---|---|
Atgriež teksta virknes pirmās rakstzīmes skaitlisko kodu. |
|
No teksta izņem pirmās 32 nedrukājamās rakstzīmes 7 bitu ASCII kodā (vērtības no 0 līdz 31). |
|
No teksta noņem 7 bitu ASCII atstarpes rakstzīmi (vērtība 32). |
|
Varat izmantot funkciju SUBSTITUTE, lai aizstātu lielākās vērtības unikoda rakstzīmes (vērtības 127, 129, 141, 143, 144, 157 un 160) ar 7 bitu ASCII rakstzīmēm, kurām tika izveidotas funkcijas TRIM un CLEAN. |
Ar skaitļiem var rasties divas galvenās problēmas, kuru dēļ var būt nepieciešams notīrīt datus: skaitlis nejauši tika importēts kā teksts, un mīnusa zīme ir jāmaina uz organizācijas standartu.
Papildinformācija |
Apraksts |
---|---|
Parāda, kā skaitļus, kas ir formatēti un saglabāti šūnās, pārvērst par tekstu, kas var radīt problēmas ar aprēķiniem vai radīt mulsinošs kārtošanas secību, uz skaitļu formātu. |
|
Konvertē skaitli teksta formātā un lieto valūtas simbolu. |
|
Vērtību konvertē par tekstu noteiktā skaitļu formātā. |
|
Noapaļo skaitli līdz norādītajam decimāldaļu skaitam, formatē skaitli decimālformatē, izmantojot punktu un komatus, un atgriež rezultātu kā tekstu. |
|
Pārvērš skaitli saturošu teksta virkni skaitlī. |
Tā kā ir daudz dažādu datumu formātu un tā kā šos formātus var jaukt ar numurētiem daļu kodiem vai citām virknēm, kurās ir slīpsvītras vai defises, datumi un laiki, bieži ir jākonvertē un jāpārformatē.
Papildinformācija |
Apraksts |
---|---|
Datumu sistēmas, formāta vai divciparu gada interpretācijas maiņa |
Apraksts par datumu sistēmas darbību programmā Office Excel. |
Parāda, kā konvertēt dažādās laika mērvienībās. |
|
Parāda, kā pārvērst datumus, kas ir formatēti un saglabāti šūnās, kā tekstu, un tas var radīt problēmas ar aprēķiniem vai radīt mulsinošs kārtošanas secību uz datuma formātu. |
|
Atgriež secīgu sērijas numuru, kas apzīmē noteiktu datumu. Ja šūnas formāts pirms funkcijas ievadīšanas ir Vispārīgs, rezultāts tiek formatēts kā datums. |
|
Konvertē ar tekstu apzīmētu datumu par sērijas numuru. |
|
Atgriež decimāldaļskaitli uz noteiktu laiku. Ja šūnas formāts pirms funkcijas ievadīšanas ir Vispārīgs, rezultāts tiek formatēts kā datums. |
|
Atgriež teksta rindā izteiktā laika decimāldaļskaitli. Decimāldaļskaitlis ir vērtība diapazonā no 0 (nulles) līdz 0,99999999, kas atbilst laikam no 0:00:00 (12:00:00 AM) līdz 23:59:59 (11:59:59 PM). |
Bieži sastopams uzdevums pēc datu importēšanas no ārēja datu avota ir divas vai vairākas kolonnas sapludināt vienā vai sadalīt vienu kolonnu divās vai vairākās kolonnās. Piemēram, varat sadalīt kolonnu, kurā ir vārds un uzvārds, vienā vārdā un uzvārdā. Var arī sadalīt kolonnu, kurā iekļauts adreses lauks, atsevišķās ielas, pilsētas, reģiona un pasta indeksa kolonnās. Šis apgrieztais arī var būt patiess. Iespējams, vēlēsities sapludināt kolonnu Vārds un Uzvārds kolonnā Pilns vārds vai apvienot atsevišķas adreses kolonnas vienā kolonnā. Papildu bieži sastopamās vērtības, kuru dēļ var būt nepieciešama sapludināšana vienā kolonnā vai sadalīšana vairākās kolonnās, ietver produktu kodus, failu ceļus un interneta protokola (IP) adreses.
Papildinformācija |
Apraksts |
---|---|
Vārda un uzvārda apvienošana Teksta un skaitļu apvienošana Teksta apvienošana ar datumu vai laiku Divu vai vairāku kolonnu apvienošana, izmantojot funkciju |
Parādīt tipiskus divu vai vairāku kolonnu vērtību apvienošanas piemērus. |
Teksta sadalīšana vairākās kolonnās, izmantojot vedni teksta konvertēšanai pa kolonnām |
Parāda, kā izmantot šo vedni, lai sadalītu kolonnas, izmantojot dažādus bieži lietotus norobežotājus. |
Parāda, kā izmantot funkcijas LEFT, MID, RIGHT, SEARCH un LEN, lai nosaukumu kolonnu sadalītu divās vai vairāk kolonnās. |
|
Parāda, kā izmantot funkciju CONCATENATE, & operatoru ("un") un vedni teksta konvertēšanai par kolonnām. |
|
Parādīts, kā izmantot komandas Sapludināt šūnas, Sapludināt pār, Sapludināt un Centrēt. |
|
Divas vai vairākas teksta virknes tiek apvienotas vienā teksta virknē. |
Lielākajā daļā Office Excel analīzes un formatēšanas līdzekļu tiek pieņemts, ka dati atrodas vienā, plakanā divdimensiju tabulā. Dažkārt, iespējams, vēlēsities, lai rindas kļūtu par kolonnām un kolonnas kļūst par rindām. Citos gadījumos dati nav pat strukturēti tabulas formātā, un ir nepieciešams veids, kā datus no tabulas tabulas pārveidot par tabulas formātu.
Papildinformācija |
Apraksts |
---|---|
Atgriež vertikālu šūnu diapazonu kā horizontālu diapazonu vai pretēji. |
|
Dažreiz datu bāzu administratori izmanto Office Excel, lai atrastu un izlabotu atbilstošās kļūdas, kad ir pievienotas divas vai vairākas tabulas. Tas var ietvert divu tabulu saskaņošanu no dažādām darblapām, piemēram, lai skatītu visus ierakstus abās tabulās vai salīdzinātu tabulas un atrastu rindas, kas nav saskaņotas.
Papildinformācija |
Apraksts |
---|---|
Parāda bieži sastopamos veidus, kā uzmeklēt datus, izmantojot uzmeklēšanas funkcijas. |
|
Atgriež vērtību no vienas rindas vai vienas kolonnas diapazona vai no masīva. Funkcijai LOOKUP ir divas sintakses formas: vektora forma un masīva forma. |
|
Meklē vērtību tabulas augšējā rindā vai vērtību masīvā un pēc tam no tabulā vai masīvā norādīta rindas atgriež vērtību tajā pašā kolonnā. |
|
Meklē vērtību tabulas masīva pirmajā kolonnā un atgriež vērtību tajā pašā rindā no citas kolonnas tabulas masīvā. |
|
No tabulas vai diapazona atgriež vērtību vai atsauci uz vērtību. Ir divas funkcijas INDEX formas: masīva forma un atsauces forma. |
|
Atgriež masīva vienuma relatīvo pozīciju, kas atbilst norādītajai vērtībai noteiktā secībā. Ja ir jāatrod nevis vienums, bet vienuma atrašanās vieta diapazonā, izmantojiet funkciju MATCH kādas LOOKUP funkcijas vietā. |
|
Atgriež atsauci uz diapazonu, kas ir noteikts šūnas vai šūnu diapazona rindu un kolonnu skaits. Atgrieztā atsauce var būt viena šūna vai šūnu diapazons. Var norādīt atgriežamo rindu un kolonnu skaitu. |
Tālāk ir minēts daļējs trešo pušu pakalpojumu sniedzēju saraksts, kuros ir produkti, kas tiek izmantoti datu tīrīšanai dažādos veidos.
Piezīme.: Microsoft nenodrošina atbalstu trešo pušu produktiem.
Provider |
Produkts |
---|---|
Add-in Express Ltd. |
|
Add-Ins.com |
|
AddinTools |
|
WinPure |