Titanic Passengers.csv
This is a manifest of passengers from on the doomed Titanic cruise. It was downloaded from the Kaggle Machine Learning Challenge in 2014 by Catherine D'Ignazio.
891 rækker af data grupperet ind i 12 kolonner.
Her er noget metadata om hver kolonne.
.
- Kolonnen er fuld af numbers
- Det mindste nummer er 1.0
- Det største nummer er 891.0
- Totalen 397386.0
- Gennemsnittet er 446.0
- Medianen er 446.0
- Standard deviationen er 257.21
- There are 891 unique values
værdi | frekvens |
---|---|
1 - 90 | 89 |
90 - 179 | 89 |
179 - 268 | 89 |
268 - 357 | 89 |
357 - 446 | 89 |
446 - 535 | 89 |
535 - 624 | 89 |
624 - 713 | 89 |
713 - 802 | 89 |
802 - 891 | 89 |
- Kolonnen er fuld af text
- The longest string has 82 characters
- There are 891 unique values
værdi | frekvens |
---|---|
mr | 521 |
miss | 182 |
mrs | 129 |
william | 64 |
john | 44 |
master | 40 |
henry | 34 |
george | 24 |
james | 24 |
charles | 24 |
thomas | 21 |
mary | 20 |
edward | 18 |
anna | 17 |
joseph | 16 |
johan | 15 |
frederick | 15 |
elizabeth | 15 |
samuel | 13 |
richard | 13 |
- Kolonnen er fuld af numbers
- Det mindste nummer er 0.42
- Det største nummer er 80.0
- Totalen 21205.17
- Gennemsnittet er 29.7
- Medianen er 28.0
- Standard deviationen er 14.52
- Der er 177 rækker af manglende data
- There are 88 unique values
værdi | frekvens |
---|---|
0 - 8 | 54 |
8 - 16 | 46 |
16 - 24 | 177 |
24 - 32 | 169 |
32 - 40 | 118 |
40 - 48 | 70 |
48 - 56 | 45 |
56 - 64 | 24 |
64 - 72 | 9 |
72 - 80 | 1 |
- Kolonnen er fuld af numbers
- Det mindste nummer er 693.0
- Det største nummer er 3101298.0
- Totalen 172070561.0
- Gennemsnittet er 260318.55
- Medianen er 3101265.0
- Standard deviationen er 471252.39
- There are 514 unique values
værdi | frekvens |
---|---|
693 - 310754 | 389 |
310754 - 620814 | 256 |
620814 - 930874 | 0 |
930874 - 1240935 | 0 |
1240935 - 1550996 | 0 |
1550996 - 1861056 | 0 |
1861056 - 2171116 | 0 |
2171116 - 2481177 | 0 |
2481177 - 2791238 | 0 |
2791238 - 3101298 | 15 |
- Kolonnen er fuld af numbers
- Det mindste nummer er 0.0
- Det største nummer er 512.3292
- Totalen 28693.95
- Gennemsnittet er 32.2
- Medianen er 14.45
- Standard deviationen er 49.67
- There are 248 unique values
værdi | frekvens |
---|---|
0 - 51 | 732 |
51 - 102 | 106 |
102 - 154 | 31 |
154 - 205 | 2 |
205 - 256 | 11 |
256 - 307 | 6 |
307 - 359 | 0 |
359 - 410 | 0 |
410 - 461 | 0 |
461 - 512 | 0 |
- Kolonnen er fuld af text
- Den oftest forekommende værdi i denne kolonne er:
- B96 B98 (4)
- C23 C25 C27 (4)
- G6 (4)
- C22 C26 (3)
- D (3)
- The longest string has 15 characters
- Der er 687 rækker af manglende data
- There are 147 unique values
værdi | frekvens |
---|---|
B96 B98 | 4 |
C23 C25 C27 | 4 |
G6 | 4 |
C22 C26 | 3 |
D | 3 |
Andet | 186 |
Hvad gør jeg nu?
At forstå dataene i din .csv fil er første skridt på vejen til at skabe en datahistorier. At se på de individuelle kolonner kan hjælpe dig med at identificere spørgsmål, som kunne være sjove at spørge dine data om. For eksempel, er det overraskende at "B96 B98" er den hyppigst anvendte værdi i kolonnen Cabin? Giver det mening at sammenligne kolonnen Sex med kolonnen Name kolonne? Er der andre datasæt, du kunne finde, for at stille flere interessante spørgsmål om kolonnen Cabin?
At stille den slags spørgsmål er det første skridt til at forstå dine data, og hvilke slags datahistorier du kan finde. Tjek vores aktivitetsguide for at få hjælp til at stille flere spørgsmål til dine data.
Få en mere gennemført analyse med et af disse værktøjer: