f | { | f | { |
n | "author": null, | n | "author": "Eduardo Flores", |
| "author_email": null, | | "author_email": "", |
| "creator_user_id": "f377ea05-7c75-49c8-8579-cfdf548ccf82", | | "creator_user_id": "f377ea05-7c75-49c8-8579-cfdf548ccf82", |
| "id": "2f4f2e93-fb20-423b-bf44-e68256bcc635", | | "id": "2f4f2e93-fb20-423b-bf44-e68256bcc635", |
| "license_id": "cc-zero", | | "license_id": "cc-zero", |
n | "maintainer": null, | n | "maintainer": "", |
| "maintainer_email": null, | | "maintainer_email": "", |
| "metadata_modified": "2017-10-25T18:02:28.805599", | | "metadata_modified": "2017-10-25T18:03:23.641051", |
| "name": "muestra-de-nombres-y-apellidos-comunes-en-mexico", | | "name": "muestra-de-nombres-y-apellidos-comunes-en-mexico", |
| "notes": "# Nombres Mexicanos\r\n\r\nPara generar un dataset | | "notes": "# Nombres Mexicanos\r\n\r\nPara generar un dataset |
| representativo de los nombres de personas en M\u00e9xico se us\u00f3 | | representativo de los nombres de personas en M\u00e9xico se us\u00f3 |
| una idea tomada de | | una idea tomada de |
| [datamx](http://datamx.io/dataset/nombres-mas-comunes-en-mexico) que | | [datamx](http://datamx.io/dataset/nombres-mas-comunes-en-mexico) que |
| utiliza una [base de datos abierta de la Secretar\u00eda de | | utiliza una [base de datos abierta de la Secretar\u00eda de |
| Educaci\u00f3n | | Educaci\u00f3n |
| P\u00fablica](http://cumplimientopef.sep.gob.mx/registro_personal/) | | P\u00fablica](http://cumplimientopef.sep.gob.mx/registro_personal/) |
| con los nombres de 1,256,438 trabajadores federalizados.\r\n\r\nLa | | con los nombres de 1,256,438 trabajadores federalizados.\r\n\r\nLa |
| limpieza y el procesamiento de los datos est\u00e1 en | | limpieza y el procesamiento de los datos est\u00e1 en |
| [analizar_nombres_sep.R](analizar_nombres_sep.R). Realiza lo | | [analizar_nombres_sep.R](analizar_nombres_sep.R). Realiza lo |
| siguiente:\r\n\r\n* Elimina duplicados usando como llave el CURP\r\n* | | siguiente:\r\n\r\n* Elimina duplicados usando como llave el CURP\r\n* |
| Obtiene el g\u00e9nero a partir del caracter 11 del CURP\r\n* Obtiene | | Obtiene el g\u00e9nero a partir del caracter 11 del CURP\r\n* Obtiene |
| el a\u00f1o de nacimiento de los caracteres 5 y 6 del CURP\r\n* | | el a\u00f1o de nacimiento de los caracteres 5 y 6 del CURP\r\n* |
| Calcula la edad de cada registro al a\u00f1o 2012 que es el de | | Calcula la edad de cada registro al a\u00f1o 2012 que es el de |
| actualizaci\u00f3n seg\u00fan la p\u00e1gina de la SEP\r\n* Calcula | | actualizaci\u00f3n seg\u00fan la p\u00e1gina de la SEP\r\n* Calcula |
| las frecuencias de los primeros y segundos apellidos, elimina los que | | las frecuencias de los primeros y segundos apellidos, elimina los que |
| tienen una frecuencia menor a 5 y elimina algunos que son basura o | | tienen una frecuencia menor a 5 y elimina algunos que son basura o |
| nulos. Crea un solo data frame y lo guarda.\r\n* Divide el dataset en | | nulos. Crea un solo data frame y lo guarda.\r\n* Divide el dataset en |
| Hombres y Mujeres, calcula las frecuencias de los nombres en cada | | Hombres y Mujeres, calcula las frecuencias de los nombres en cada |
| caso, elimina los que tienen una frecuencia menor a 5, calcula la edad | | caso, elimina los que tienen una frecuencia menor a 5, calcula la edad |
| promedio para cada nimbre y guarda el data frame\r\n\r\nSe usa un | | promedio para cada nimbre y guarda el data frame\r\n\r\nSe usa un |
| formato similar al de los [nombres y apellidos frecuentes en | | formato similar al de los [nombres y apellidos frecuentes en |
| Espa\u00f1a](https://github.com/marcboquet/spanish-names/) de donde se | | Espa\u00f1a](https://github.com/marcboquet/spanish-names/) de donde se |
| inspir\u00f3 este proyecto. Hay que notar que es una muestra grande | | inspir\u00f3 este proyecto. Hay que notar que es una muestra grande |
| pero dos \u00f3rdenes de magnitud menor a lo que ser\u00eda una | | pero dos \u00f3rdenes de magnitud menor a lo que ser\u00eda una |
| completa y que est\u00e1 segmentada al ser \u00fanicamente | | completa y que est\u00e1 segmentada al ser \u00fanicamente |
| trabajadores de la SEP. Los archivos originales y procesados estan en | | trabajadores de la SEP. Los archivos originales y procesados estan en |
| [data/sep](data/sep).\r\n", | | [data/sep](data/sep).\r\n", |
| "owner_org": null, | | "owner_org": null, |
| "private": false, | | "private": false, |
n | "revision_id": "0a6dd4e7-f740-4d4f-b77f-c66592b5fa04", | n | "revision_id": "870d80a2-b1f1-49e9-9599-ec1b31c2a58c", |
| "state": "draft", | | "state": "active", |
| "title": "Muestra de Nombres y Apellidos Comunes en M\u00e9xico", | | "title": "Muestra de Nombres y Apellidos Comunes en M\u00e9xico", |
| "type": "dataset", | | "type": "dataset", |
t | "url": null, | t | "url": "http://cumplimientopef.sep.gob.mx/registro_personal/", |
| "version": null | | "version": "1.0" |
| } | | } |