Los datos sucios en el CRM son «ivanov iván ivánovich» en una sola línea del campo de nombre, teléfonos escritos de diez formas, erratas en el correo y en los comentarios. Una base así rompe la generación de documentos, la personalización de los correos y la búsqueda de duplicados. Analizamos cuatro robots que limpian los datos dentro del propio proceso de negocio: desglose del nombre completo en partes con detección del género, validación del email antes del envío, operador y región por número de teléfono, corrección de erratas en el texto.
¿De dónde salen los datos sucios en el CRM y en qué molestan?
Hay tres fuentes. Formularios y chats: el cliente escribe el nombre en minúsculas y en un orden arbitrario. Importación: una base antigua trae sus propios formatos. Entrada manual: el comercial va con prisa, «ivanov i.i.», un ocho en lugar de «+7», erratas. Después la suciedad se extiende por el sistema: en el contrato por plantilla acaba «estimado ivanov iván», el envío llega a direcciones inexistentes y arruina la reputación del dominio remitente, y la búsqueda de duplicados no entiende que «+7 912…» y «8 912…» son la misma persona (más detalles, en el artículo sobre duplicados en Bitrix24). Lo más correcto es limpiar los datos en el momento en que aparecen, con robots dentro del proceso de creación de un prospecto o un contacto, antes de que la suciedad se propague.
¿Cómo desglosar el nombre completo en apellido, nombre y patronímico?
En el campo hay «petrov piotr petróvich» en una sola línea, el orden de las palabras es cualquiera, las mayúsculas son aleatorias. Para documentos y formas de tratamiento se necesitan las partes por separado, y no hay herramientas estándar para cortar el campo. El robot «Desglosar nombre completo» recibe la cadena con el nombre completo y, a través del servicio de estandarización DaData, la descompone en partes. Salida: apellido, nombre y patronímico como valores separados, género (M/F/ND), nombre completo normalizado con las mayúsculas corregidas y un indicador «Reconocido» (S/N). Las partes se escriben en campos del contacto separados, el género se usa para la forma de tratamiento correcta en las plantillas de correos y documentos, y por el indicador N se crea una tarea para revisar la ficha a mano: la cadena no parecía un nombre completo.
¿Cómo validar el email antes de un envío?
Una errata en la dirección es un correo no entregado; las direcciones desechables y de rol son quejas por spam y estadísticas de envío arruinadas. No existe una validación estándar de email en los procesos de negocio. El robot «Validación de email» normaliza la dirección a través del servicio de estandarización y devuelve: el email corregido, el tipo de dirección —personal, corporativa, de rol o desechable— y los indicadores «Válido» y «Reconocido» (S/N). La receta: el proceso de creación de un contacto pasa la dirección por el robot; cuando «Válido = N», la ficha se marca y no entra en el segmento del envío; una dirección desechable es motivo para dudar del prospecto; a una de rol (info@, sales@) no tiene sentido escribirle un correo personal. La dirección normalizada se vuelve a escribir en el campo.
¿Cómo averiguar el operador y la región por el teléfono?
El número está en la ficha, pero no la región ni la zona horaria, y el comercial llama a Vladivostok a las tres de la madrugada hora local. El robot «Teléfono: operador y región» recibe el número en cualquier formato y devuelve: el teléfono normalizado, el tipo de línea, el operador, la región, la zona horaria y los indicadores «Válido» y «Reconocido» (S/N). La detección, igual que el desglose del nombre completo, se hace a través del servicio de estandarización DaData. Los resultados se escriben en los campos de la ficha y funcionan en las condiciones del proceso: enrutar el prospecto al comercial regional, elegir la franja para la llamada según la zona horaria, descartar números incorrectos antes de pasar la lista a la campaña de llamadas.
¿Cómo corregir las erratas en el texto?
«Buenos días» se convierte fácilmente en «bueons días», y el nombre de la empresa en un revoltijo de letras de la distribución de teclado equivocada. En los comentarios es tolerable; en los campos de los que se montan documentos y correos, no. El robot «Corregir erratas» pasa el texto por el servicio de corrección ortográfica: corrige las erratas típicas en texto ruso e inglés, reconoce palabras escritas con la distribución de teclado equivocada. Salida: el texto corregido y un indicador de si hubo corrección. La receta: antes de generar un documento, el campo se pasa por el robot; si hubo corrección, el texto actualizado se vuelve a escribir, y por el indicador la ficha puede marcarse para una revisión selectiva, ya que la corrección automática a veces requiere una mirada humana.
Lista de comprobación
Limpia los datos a la entrada: en el proceso de creación de un prospecto, desglose del nombre completo, validación de email y teléfono; antes del envío, descarte de direcciones incorrectas, desechables y de rol; antes de generar documentos, erratas y mayúsculas. Los cuatro robots están en el catálogo de Roboteka, se instalan gratis desde Bitrix24.Market y funcionan en el diseñador de procesos junto a las acciones estándar. Si no encuentras la comprobación que necesitas, describe la tarea y crearemos el robot gratis y lo añadiremos a la biblioteca común.