This is a manifest of passengers from on the doomed Titanic cruise. It was downloaded from the Kaggle Machine Learning Challenge in 2014 by Catherine D'Ignazio.

891 rækker af data grupperet ind i 12 kolonner.
Her er noget metadata om hver kolonne.

.

PassengerId

  • Kolonnen er fuld af numbers
  • Det mindste nummer er 1.0
  • Det største nummer er 891.0
  • Totalen 397386.0
  • Gennemsnittet er 446.0
  • Medianen er 446.0
  • Standard deviationen er 257.21
  • There are 891 unique values
værdi frekvens
1 - 90 89
90 - 179 89
179 - 268 89
268 - 357 89
357 - 446 89
446 - 535 89
535 - 624 89
624 - 713 89
713 - 802 89
802 - 891 89

PassengerId

  • Kolonnen er fuld af numbers
  • Det mindste nummer er 1.0
  • Det største nummer er 891.0
  • Totalen 397386.0
  • Gennemsnittet er 446.0
  • Medianen er 446.0
  • Standard deviationen er 257.21
  • There are 891 unique values

Survived

  • Kolonnen er fuld af numbers
  • Den oftest forekommende værdi i denne kolonne er:
    • 0.0 (549)
    • 1.0 (342)
værdi frekvens
0.0 549
1.0 342

Survived

  • Kolonnen er fuld af numbers
  • Den oftest forekommende værdi i denne kolonne er:
    • 0.0 (549)
    • 1.0 (342)

Pclass

  • Kolonnen er fuld af numbers
  • Den oftest forekommende værdi i denne kolonne er:
    • 1.0 (216)
    • 2.0 (184)
    • 3.0 (491)
værdi frekvens
1.0 216
2.0 184
3.0 491

Pclass

  • Kolonnen er fuld af numbers
  • Den oftest forekommende værdi i denne kolonne er:
    • 1.0 (216)
    • 2.0 (184)
    • 3.0 (491)

Name

  • Kolonnen er fuld af text
  • The longest string has 82 characters
  • There are 891 unique values
værdi frekvens
mr 521
miss 182
mrs 129
william 64
john 44
master 40
henry 34
george 24
james 24
charles 24
thomas 21
mary 20
edward 18
anna 17
joseph 16
johan 15
frederick 15
elizabeth 15
samuel 13
richard 13

Name

  • Kolonnen er fuld af text
  • The longest string has 82 characters
  • There are 891 unique values

Sex

  • Kolonnen er fuld af text
  • De unikke værdier i denne kolonne er:
    • male (577)
    • female (314)
værdi frekvens
male 577
female 314

Sex

  • Kolonnen er fuld af text
  • De unikke værdier i denne kolonne er:
    • male (577)
    • female (314)

Age

  • Kolonnen er fuld af numbers
  • Det mindste nummer er 0.42
  • Det største nummer er 80.0
  • Totalen 21205.17
  • Gennemsnittet er 29.7
  • Medianen er 28.0
  • Standard deviationen er 14.52
  • Der er 177 rækker af manglende data
  • There are 88 unique values
værdi frekvens
0 - 8 54
8 - 16 46
16 - 24 177
24 - 32 169
32 - 40 118
40 - 48 70
48 - 56 45
56 - 64 24
64 - 72 9
72 - 80 1

Age

  • Kolonnen er fuld af numbers
  • Det mindste nummer er 0.42
  • Det største nummer er 80.0
  • Totalen 21205.17
  • Gennemsnittet er 29.7
  • Medianen er 28.0
  • Standard deviationen er 14.52
  • Der er 177 rækker af manglende data
  • There are 88 unique values

SibSp

  • Kolonnen er fuld af numbers
  • Den oftest forekommende værdi i denne kolonne er:
    • 0.0 (608)
    • 1.0 (209)
    • 2.0 (28)
    • 3.0 (16)
    • 4.0 (18)
    • 5.0 (5)
    • 8.0 (7)
værdi frekvens
0.0 608
1.0 209
2.0 28
3.0 16
4.0 18
5.0 5
8.0 7

SibSp

  • Kolonnen er fuld af numbers
  • Den oftest forekommende værdi i denne kolonne er:
    • 0.0 (608)
    • 1.0 (209)
    • 2.0 (28)
    • 3.0 (16)
    • 4.0 (18)
    • 5.0 (5)
    • 8.0 (7)

Parch

  • Kolonnen er fuld af numbers
  • Den oftest forekommende værdi i denne kolonne er:
    • 0.0 (678)
    • 1.0 (118)
    • 2.0 (80)
    • 3.0 (5)
    • 4.0 (4)
    • 5.0 (5)
    • 6.0 (1)
værdi frekvens
0.0 678
1.0 118
2.0 80
3.0 5
4.0 4
5.0 5
6.0 1

Parch

  • Kolonnen er fuld af numbers
  • Den oftest forekommende værdi i denne kolonne er:
    • 0.0 (678)
    • 1.0 (118)
    • 2.0 (80)
    • 3.0 (5)
    • 4.0 (4)
    • 5.0 (5)
    • 6.0 (1)

Ticket

  • Kolonnen er fuld af numbers
  • Det mindste nummer er 693.0
  • Det største nummer er 3101298.0
  • Totalen 172070561.0
  • Gennemsnittet er 260318.55
  • Medianen er 3101265.0
  • Standard deviationen er 471252.39
  • There are 514 unique values
værdi frekvens
693 - 310754 389
310754 - 620814 256
620814 - 930874 0
930874 - 1240935 0
1240935 - 1550996 0
1550996 - 1861056 0
1861056 - 2171116 0
2171116 - 2481177 0
2481177 - 2791238 0
2791238 - 3101298 15

Ticket

  • Kolonnen er fuld af numbers
  • Det mindste nummer er 693.0
  • Det største nummer er 3101298.0
  • Totalen 172070561.0
  • Gennemsnittet er 260318.55
  • Medianen er 3101265.0
  • Standard deviationen er 471252.39
  • There are 514 unique values

Fare

  • Kolonnen er fuld af numbers
  • Det mindste nummer er 0.0
  • Det største nummer er 512.3292
  • Totalen 28693.95
  • Gennemsnittet er 32.2
  • Medianen er 14.45
  • Standard deviationen er 49.67
  • There are 248 unique values
værdi frekvens
0 - 51 732
51 - 102 106
102 - 154 31
154 - 205 2
205 - 256 11
256 - 307 6
307 - 359 0
359 - 410 0
410 - 461 0
461 - 512 0

Fare

  • Kolonnen er fuld af numbers
  • Det mindste nummer er 0.0
  • Det største nummer er 512.3292
  • Totalen 28693.95
  • Gennemsnittet er 32.2
  • Medianen er 14.45
  • Standard deviationen er 49.67
  • There are 248 unique values

Cabin

  • Kolonnen er fuld af text
  • Den oftest forekommende værdi i denne kolonne er:
    • B96 B98 (4)
    • C23 C25 C27 (4)
    • G6 (4)
    • C22 C26 (3)
    • D (3)
  • The longest string has 15 characters
  • Der er 687 rækker af manglende data
  • There are 147 unique values
værdi frekvens
B96 B98 4
C23 C25 C27 4
G6 4
C22 C26 3
D 3
Andet 186

Cabin

  • Kolonnen er fuld af text
  • Den oftest forekommende værdi i denne kolonne er:
    • B96 B98 (4)
    • C23 C25 C27 (4)
    • G6 (4)
    • C22 C26 (3)
    • D (3)
  • The longest string has 15 characters
  • Der er 687 rækker af manglende data
  • There are 147 unique values

Embarked

  • Kolonnen er fuld af text
  • De unikke værdier i denne kolonne er:
    • S (644)
    • C (168)
    • Q (77)
  • Der er 2 rækker af manglende data
værdi frekvens
S 644
C 168
Q 77

Embarked

  • Kolonnen er fuld af text
  • De unikke værdier i denne kolonne er:
    • S (644)
    • C (168)
    • Q (77)
  • Der er 2 rækker af manglende data

Hvad gør jeg nu?

At forstå dataene i din .csv fil er første skridt på vejen til at skabe en datahistorier. At se på de individuelle kolonner kan hjælpe dig med at identificere spørgsmål, som kunne være sjove at spørge dine data om. For eksempel, er det overraskende at "0.0" er den hyppigst anvendte værdi i kolonnen Survived? Giver det mening at sammenligne kolonnen Name med kolonnen Age kolonne? Er der andre datasæt, du kunne finde, for at stille flere interessante spørgsmål om kolonnen Survived?

At stille den slags spørgsmål er det første skridt til at forstå dine data, og hvilke slags datahistorier du kan finde. Tjek vores aktivitetsguide for at få hjælp til at stille flere spørgsmål til dine data.

Få en mere gennemført analyse med et af disse værktøjer: