Descripción del Problema "German Credit"


Título: "German Credit"

Descripción:

Este problema describe a los clientes como riesgos buenos o malos para un crédito según ciertos atributos de los clientes. Viene con una matriz de costes.

Tipo y Tamaño:

Proposicional. 1 Tabla.
Número de ejemplos: 1.000
Número de atributos: 21 (7 numéricos, 14 categóricos/nominales, incluyendo la "clase").
Tamaño total: 1 x 1.000 x 21 = 21.000 campos.

Presentación:

Un solo fichero textual sin separación entre entrenamiento y validación.

Tareas más apropiadas:

Utilizable para clasificación, asociaciones, correlaciones y agrupamiento.
Especialmente útil para ilustrar aprendizaje sensible al coste y diseño de campañas de "márketing".

Descripción Atributos: (POR TRADUCIR AL CASTELLANO)

Attribute 1:  (qualitative)
             Status of existing checking account
              A11 :      ... <    0 DM
             A12 : 0 <= ... <  200 DM
             A13 :      ... >= 200 DM /
               salary assignments for at least 1 year
              A14 : no checking account

Attribute 2:  (numerical)
            Duration in month

Attribute 3:  (qualitative)
            Credit history
            A30 : no credits taken/
              all credits paid back duly
             A31 : all credits at this bank paid back duly
            A32 : existing credits paid back duly till now
             A33 : delay in paying off in the past
            A34 : critical account/
              other credits existing (not at this bank)

Attribute 4:  (qualitative)
            Purpose
            A40 : car (new)
            A41 : car (used)
            A42 : furniture/equipment
            A43 : radio/television
            A44 : domestic appliances
            A45 : repairs
            A46 : education
            A47 : (vacation - does not exist?)
            A48 : retraining
            A49 : business
            A410 : others

Attribute 5:  (numerical)
            Credit amount

Attibute 6:  (qualitative)
            Savings account/bonds
            A61 :         ... <  100 DM
            A62 :   100 <= ... < 500 DM
            A63 :   500 <= ... < 1000 DM
            A64 :         .. >= 1000 DM
             A65 :   unknown/ no savings account

Attribute 7:  (qualitative)
            Present employment since
            A71 : unemployed
            A72 :       ... < 1 year
            A73 : 1  <= ... < 4 years 
            A74 : 4  <= ... < 7 years
            A75 :       .. >= 7 years

Attribute 8:  (numerical)
            Installment rate in percentage of disposable income

Attribute 9:  (qualitative)
            Personal status and sex
            A91 : male   : divorced/separated
            A92 : female : divorced/separated/married
             A93 : male   : single
            A94 : male   : married/widowed
            A95 : female : single

Attribute 10: (qualitative)
            Other debtors / guarantors
            A101 : none
            A102 : co-applicant
            A103 : guarantor

Attribute 11: (numerical)
            Present residence since

Attribute 12: (qualitative)
            Property
            A121 : real estate
            A122 : if not A121 : building society savings agreement/
                         life insurance
             A123 : if not A121/A122 : car or other, not in attribute 6
            A124 : unknown / no property

Attribute 13: (numerical)
            Age in years

Attribute 14: (qualitative)
            Other installment plans
            A141 : bank
            A142 : stores
            A143 : none

Attribute 15: (qualitative)
            Housing
            A151 : rent
            A152 : own
            A153 : for free

Attribute 16: (numerical)
             Number of existing credits at this bank

Attribute 17: (qualitative)
            Job
            A171 : unemployed/ unskilled  - non-resident
            A172 : unskilled - resident
            A173 : skilled employee / official
            A174 : management/ self-employed/
               highly qualified employee/ officer

Attribute 18: (numerical)
            Number of people being liable to provide maintenance for

Attribute 19: (qualitative)
            Telephone
            A191 : none
            A192 : yes, registered under the customers name

Attribute 20: (qualitative)
            foreign worker
            A201 : yes
            A202 : no

Attribute 21 (CLASS): (qualitative)
            foreign worker
            1: good
            2: bad

Matriz de Coste:

Este problema se puede aplicar con la siguiente matriz de coste:



Real


1 (bueno)
2 (malo)
Predicho
1 (bueno) 0
1
2 (malo)
5
0


Lo que representa esta matriz es que es peor clasificar un cliente como bueno cuando es malo (5) que clasificarlo como malo cuando es bueno (1).

Fuente y Agradecimientos:

Se ha extraído del repositorio UCI del directorio "Statlog Databases". La fecha del dataset es octubre 1992.
Hay que citar agradecimientos de:

Donors:    Ross D. King
                Department of Statistics and Modelling Science
                University of Strathclyde
                Glasgow G1 1XH
                Scotland
                U.K.
                +44 41 552-4400 x 3033
                Fax +44 41 552-4711
                ross@turing.uk.ac

                Professor Dr. Hans Hofmann 
                Institut f"ur Statistik und "Okonometrie 
                Universit"at Hamburg 
                FB Wirtschaftswissenschaften 
                Von-Melle-Park 5   
                2000 Hamburg 13


Información asociada al libro "Introducción a la Minería de Datos".
(C) José Hernández Orallo, M.José Ramírez Quintana, Cèsar Ferri Ramírez.
Última actualización: 8 de mayo de 2003.