Data Factory
Bienvenido a la mayor Fábrica de Datos de España
Data Factory
Bienvenido a la mayor Fábrica de Datos de España
Crea datos a medida de tus necesidades
Si dentro de nuestros datasets no encuentras la información que necesitas, podemos crearlos a la carta. Si la información que necesitas está en diversos sitios de internet que necesitas combinar con información propia u open data, probablemente podamos ayudarte. Con nuestra capacidad de web crawling, web scrapping y modelización de datos, podemos crear datos a medida según tus necesidades específicas.
Si necesitas combinar información de distintas fuentes, ya sea de sitios web o de datos propios, podemos ayudarte a crear el fichero que necesitas para tu solución de datos. Nosotros lo llamamos Data Factory.
Crea datos a medida de tus necesidades
Si dentro de nuestros datasets no encuentras la información que necesitas, podemos crearlos a la carta. Si la información que necesitas está en diversos sitios de internet que necesitas combinar con información propia u open data, probablemente podamos ayudarte. Con nuestra capacidad de web crawling, web scrapping y modelización de datos, podemos crear datos a medida según tus necesidades específicas.
Si necesitas combinar información de distintas fuentes, ya sea de sitios web o de datos propios, podemos ayudarte a crear el fichero que necesitas para tu solución de datos. Nosotros lo llamamos Data Factory.
Procesos del Data Factory
Identificación de los datos a tratar
Automatización de la extracción de los datos
Tratamiento básico de los datos (normalización, deduplicación)
Etiquetado de los datos (o creación de diccionario y taxonomía)
Creación de un gráfico de conocimiento o knowledge graph
(Opcional)
Algoritmia simple o compleja aplicada a los datos (AI/ML)
Integración de los resultados para su consumo: Publicaciones, enriquecimiento de otros sistemas (BI, CRM…)
Verificación de la integridad de la información
Identificación de los datos a tratar
Automatización de la extracción de los datos
Tratamiento básico de los datos (normalización, deduplicación)
Etiquetado de los datos (o creación de diccionario y taxonomía)
Creación de un gráfico de conocimiento o knowledge graph
(Opcional)
Algoritmia simple o compleja aplicada a los datos (AI/ML)
Integración de los resultados para su consumo: Publicaciones, enriquecimiento de otros sistemas (BI, CRM…)
Verificación de la integridad de la información
- Identificación de los datos a tratar
- Automatización de la extracción de los datos
- Tratamiento básico de los datos (normalización, deduplicación)
- Etiquetado de los datos (o creación de diccionario y taxonomía)
- Opcional: creación de un gráfico de conocimiento o knowledge graph
- Algoritmia simple o compleja aplicada a los datos (AI/ML)
- Integración de los resultados para su consumo: Publicaciones, enriquecimiento de otros sistemas (BI, CRM…)
- Verificación de la integridad de la información
Aplicaciones de nuestros servicios de Data Factory
Una técnica con tanto potencial solo tú puedes saber cómo puede ser útil en tu negocio. Cuéntanos tu problemática y te asesoraremos. Algunas aplicaciones que tiene para nuestros clientes:
Dataset a medida
Creación de bases de datos de alta calidad personalizadas segun tus necesidades a partir de internet.
Monitorización de la marca
Vigila la reputación de tu marca y haz un seguimiento de las menciones y valoraciones online de forma automática.
Investigación de mercado
Incluye internet como fuente de conocimiento para tomar decisiones de negocio: Análisis de la competencia, entrada en nuevos mercados, busquéda de relaciones, comparación de precios en tiendas, detección de cambios en sitios webs…
Datos financieros alternativos
Toma decisiones informadas con datos financieros alternativos extraidos de internet.
Generación de leads
Crea listas de potenciales clientes empresa con característica web: listados de ecommerce, empresas con linkedin en su site, compañías que utilizan paypal como pasarela de pago.
Automatización de procesos
Automatiza tus informes, relaciona datos internos con otras fuentes externas, incluyendo internet.
¿QUIERES EMPEZAR A CREAR TU BASE DE DATOS
A MEDIDA CON DATA FACTORY?
Casos de data sets creados con Data Factory
Puntos de interés a medida para aplicaciones y servicios de mapas
Las principales empresas americanas de mapas directoriales en el mercado internacional buscaban mejorar la precisión y mejorar la cualificación de ubicaciones de interés en España. En este caso a través de la calidad de nuestro callejero y portalero, como partner local, se proporcionó las coordenadas X,Y para mejorar la precisión de puntos de interés como aeropuertos, comercios o empresas. A partir de aquí también se generaron nuevos puntos de interés combinando múltiples fuentes de datos, algunas como rutas de senderismo, iglesias, farmacias de guardia etc…
Certificado de Eficiencia Energética (CEE)
Existe una creciente sensibilización de clientes, entidades bancarias y aseguradoras ante el cambio climático y el correcto cumplimiento de sus obligaciones en materia de responsabilidad social corporativa. Como consecuencia un cliente tuvo la necesidad de disponer de manera inminente los Certificados de Eficiencia Energética (CEE) de su cartera de inmuebles o de los inmuebles asociados a sus servicios. Actualmente menos del 20% de todo el parque de inmuebles de España tiene un CEE oficial.
En Deyde DataCentric se desarrolló un sistema que permite extraer las etiquetas reales de las diferentes fuentes que las publican. Y para los inmuebles sin esta certificación oficial, se desarrollaron modelos matemáticos que, alimentados por datos de certificaciones reales y de los testigos de las tasaciones correspondientes, permitió estimar las letras y números de emisiones y consumos. Datos creados de forma exclusiva que nuestro cliente incorporó a los registros de su cartera de inmuebles.
Riesgos medioambientales
La creciente aparición de fenómenos naturales extremos como consecuencia del cambio climático generó a un cliente asegurador la necesidad de controlar al máximo el riesgo de sus activos asegurados.
Para ello se generaron una serie de capas cartográficas con información sobre la existencia de riesgos naturales para todo el territorio nacional, las cuales fueron incorporadas a nivel de registro. Se obtuvieron 3 capas distintas correspondientes a:
- Riesgo por inundación (fluvial y marítima)
- Riesgo de desertificación
- Riesgo sísmico
En cada una de estas capas -además de los indicadores propios asociados a cada tipo de riesgo- se construyeron varios indicadores adicionales: el indicador frecuencia, que da información sobre la probabilidad de que se produzca el evento correspondiente, y el indicador magnitud, que informa sobre el daño esperado en caso de que éste suceda.
Indicador de Madurez Digital
Junto con un cliente nuestro que comercializa productos tecnológicos llegamos a la conclusión que la madurez digital podía ser una variable importante a la hora de segmentar su base de datos para dirigir las campañas comerciales. La madurez digital de una compañía no es un dato que exista como tal en ninguna fuente de información, así que nos dispusimos a crearlo.
En este caso con técnicas de web crawling y web scraping partimos de la huella digital de las empresas, que corresponde a toda la información que se puede obtener de sus dominios y páginas web.
Tras asociar de forma segura una empresa con sus dominios, en Deyde DataCentric aplicamos una serie de procesos basados en NER (Name Entity Recognition) y NLP (Natural Language Processing) para sacar la información de estos datos brutos.
A través de diferentes indicadores que extrajimos de esta huella digital, hemos creado un Indicador de Madurez Digital de empresas y su evolución con el tiempo.
Valor de reconstrucción de una vivienda
Un cliente del sector bancario necesitaba crear un dato para estimar el valor de inmuebles, lo más fiable posible, cuando se ejecuta una hipoteca
Así creamos el valor de reconstrucción de un inmueble. El valor se obtiene multiplicando los metros cuadrados de superficie construida por el valor promedio de reconstrucción de una vivienda de las mismas características. Es decir que no se trata sólo de metros cuadrados, sino que influye el tipo de vivienda, materiales de construcción predominantes y zona geográfica.
Otro cliente del sector asegurador ya lo usa para mejorar el cálculo de las primas del hogar.
Casos de data sets creados con Data Factory
Puntos de interés a medida para aplicaciones y servicios de mapas
Las principales empresas americanas de mapas directoriales en el mercado internacional buscaban mejorar la precisión y mejorar la cualificación de ubicaciones de interés en España. En este caso a través de la calidad de nuestro callejero y portalero, como partner local, se proporcionó las coordenadas X,Y para mejorar la precisión de puntos de interés como aeropuertos, comercios o empresas. A partir de aquí también se generaron nuevos puntos de interés combinando múltiples fuentes de datos, algunas como rutas de senderismo, iglesias, farmacias de guardia etc…
Certificado de Eficiencia Energética (CEE)
Existe una creciente sensibilización de clientes, entidades bancarias y aseguradoras ante el cambio climático y el correcto cumplimiento de sus obligaciones en materia de responsabilidad social corporativa. Como consecuencia un cliente tuvo la necesidad de disponer de manera inminente los Certificados de Eficiencia Energética (CEE) de su cartera de inmuebles o de los inmuebles asociados a sus servicios. Actualmente menos del 20% de todo el parque de inmuebles de España tiene un CEE oficial. En Deyde DataCentric se desarrolló un sistema que permite extraer las etiquetas reales de las diferentes fuentes que las publican. Y para los inmuebles sin esta certificación oficial, se desarrollaron modelos matemáticos que, alimentados por datos de certificaciones reales y de los testigos de las tasaciones correspondientes, permitió estimar las letras y números de emisiones y consumos. Datos creados de forma exclusiva que nuestro cliente incorporó a los registros de su cartera de inmuebles.
Riesgos medioambientales
La creciente aparición de fenómenos naturales extremos como consecuencia del cambio climático generó a un cliente asegurador la necesidad de controlar al máximo el riesgo de sus activos asegurados. Para ello se generaron una serie de capas cartográficas con información sobre la existencia de riesgos naturales para todo el territorio nacional, las cuales fueron incorporadas a nivel de registro. Se obtuvieron 3 capas distintas correspondientes a:
- Riesgo por inundación (fluvial y marítima)
- Riesgo de desertificación
- Riesgo sísmico
En cada una de estas capas -además de los indicadores propios asociados a cada tipo de riesgo- se construyeron varios indicadores adicionales: el indicador frecuencia, que da información sobre la probabilidad de que se produzca el evento correspondiente, y el indicador magnitud, que informa sobre el daño esperado en caso de que éste suceda.
Indicador de Madurez Digital
Junto con un cliente nuestro que comercializa productos tecnológicos llegamos a la conclusión que la madurez digital podía ser una variable importante a la hora de segmentar su base de datos para dirigir las campañas comerciales. La madurez digital de una compañía no es un dato que exista como tal en ninguna fuente de información, así que nos dispusimos a crearlo. En este caso con técnicas de web crawling y web scraping partimos de la huella digital de las empresas, que corresponde a toda la información que se puede obtener de sus dominios y páginas web. Tras asociar de forma segura una empresa con sus dominios, en Deyde DataCentric aplicamos una serie de procesos basados en NER (Name Entity Recognition) y NLP (Natural Language Processing) para sacar la información de estos datos brutos. A través de diferentes indicadores que extrajimos de esta huella digital, hemos creado un Indicador de Madurez Digital de empresas y su evolución con el tiempo.
Valor de reconstrucción de una vivienda
Un cliente del sector bancario necesitaba crear un dato para estimar el valor de inmuebles, lo más fiable posible, cuando se ejecuta una hipoteca Así creamos el valor de reconstrucción de un inmueble. El valor se obtiene multiplicando los metros cuadrados de superficie construida por el valor promedio de reconstrucción de una vivienda de las mismas características. Es decir que no se trata sólo de metros cuadrados, sino que influye el tipo de vivienda, materiales de construcción predominantes y zona geográfica. Otro cliente del sector asegurador ya lo usa para mejorar el cálculo de las primas del hogar.
Casos de data sets creados con Data Factory
Puntos de interés a medida para aplicaciones y servicios de mapas
Las principales empresas americanas de mapas directoriales en el mercado internacional buscaban mejorar la precisión y mejorar la cualificación de ubicaciones de interés en España. En este caso a través de la calidad de nuestro callejero y portalero, como partner local, se proporcionó las coordenadas X,Y para mejorar la precisión de puntos de interés como aeropuertos, comercios o empresas. A partir de aquí también se generaron nuevos puntos de interés combinando múltiples fuentes de datos, algunas como rutas de senderismo, iglesias, farmacias de guardia etc…
Certificado de Eficiencia Energética (CEE)
Existe una creciente sensibilización de clientes, entidades bancarias y aseguradoras ante el cambio climático y el correcto cumplimiento de sus obligaciones en materia de responsabilidad social corporativa. Como consecuencia un cliente tuvo la necesidad de disponer de manera inminente los Certificados de Eficiencia Energética (CEE) de su cartera de inmuebles o de los inmuebles asociados a sus servicios. Actualmente menos del 20% de todo el parque de inmuebles de España tiene un CEE oficial. En Deyde DataCentric se desarrolló un sistema que permite extraer las etiquetas reales de las diferentes fuentes que las publican. Y para los inmuebles sin esta certificación oficial, se desarrollaron modelos matemáticos que, alimentados por datos de certificaciones reales y de los testigos de las tasaciones correspondientes, permitió estimar las letras y números de emisiones y consumos. Datos creados de forma exclusiva que nuestro cliente incorporó a los registros de su cartera de inmuebles.
Riesgos medioambientales
La creciente aparición de fenómenos naturales extremos como consecuencia del cambio climático generó a un cliente asegurador la necesidad de controlar al máximo el riesgo de sus activos asegurados. Para ello se generaron una serie de capas cartográficas con información sobre la existencia de riesgos naturales para todo el territorio nacional, las cuales fueron incorporadas a nivel de registro. Se obtuvieron 3 capas distintas correspondientes a:
- Riesgo por inundación (fluvial y marítima)
- Riesgo de desertificación
- Riesgo sísmico
En cada una de estas capas -además de los indicadores propios asociados a cada tipo de riesgo- se construyeron varios indicadores adicionales: el indicador frecuencia, que da información sobre la probabilidad de que se produzca el evento correspondiente, y el indicador magnitud, que informa sobre el daño esperado en caso de que éste suceda.
Indicador de Madurez Digital
Junto con un cliente nuestro que comercializa productos tecnológicos llegamos a la conclusión que la madurez digital podía ser una variable importante a la hora de segmentar su base de datos para dirigir las campañas comerciales. La madurez digital de una compañía no es un dato que exista como tal en ninguna fuente de información, así que nos dispusimos a crearlo. En este caso con técnicas de web crawling y web scraping partimos de la huella digital de las empresas, que corresponde a toda la información que se puede obtener de sus dominios y páginas web. Tras asociar de forma segura una empresa con sus dominios, en Deyde DataCentric aplicamos una serie de procesos basados en NER (Name Entity Recognition) y NLP (Natural Language Processing) para sacar la información de estos datos brutos. A través de diferentes indicadores que extrajimos de esta huella digital, hemos creado un Indicador de Madurez Digital de empresas y su evolución con el tiempo.
Valor de reconstrucción de una vivienda
Un cliente del sector bancario necesitaba crear un dato para estimar el valor de inmuebles, lo más fiable posible, cuando se ejecuta una hipoteca Así creamos el valor de reconstrucción de un inmueble. El valor se obtiene multiplicando los metros cuadrados de superficie construida por el valor promedio de reconstrucción de una vivienda de las mismas características. Es decir que no se trata sólo de metros cuadrados, sino que influye el tipo de vivienda, materiales de construcción predominantes y zona geográfica. Otro cliente del sector asegurador ya lo usa para mejorar el cálculo de las primas del hogar.
Pyramid, suma valor a tu información con datos modelizados exclusivos que no existen en ninguna otra fuente de datos
Crea nueva información de valor relacionando tus datos con nuestra fuente de datos llamada Pyramid. Con Pyramid tendrás en una sola interfaz varias fuentes de información integradas, desde datos exclusivos de Deyde DataCentric que no existen en ninguna otra fuente de información hasta open data ya preprocesada y validada lista para consumir. Contamos con datos del tejido empresarial como facturación o volumen de empleados, más de 3200 datos de consumidores e indicadores del entorno asociados a un punto geográfico y datos inmobiliarios de España y Portugal.
Una solución flexible y adaptable a multitud de problemáticas que contiene el mayor compendio de datos, 100% compliance con GDPR y consumible en tiempo real a través de webservices.
Crea nueva información de valor relacionando tus datos con nuestra fuente de datos llamada Pyramid. Con Pyramid tendrás en una sola interfaz varias fuentes de información integradas, desde datos exclusivos de Deyde DataCentric que no existen en ninguna otra fuente de información hasta open data ya preprocesada y validada lista para consumir. Contamos con datos del tejido empresarial como facturación o volumen de empleados, más de 3200 datos de consumidores e indicadores del entorno asociados a un punto geográfico y datos inmobiliarios de España y Portugal.
Una solución flexible y adaptable a multitud de problemáticas que contiene el mayor compendio de datos, 100% compliance con GDPR y consumible en tiempo real a través de webservices.
¿Te siguen faltando datos? Utiliza internet como fuente de datos
Utilizamos internet como fuente de datos y extraemos la información que necesitas a medida para tus proyectos con procesos similares a los que utilizan los buscadores para escanear e indexar las páginas web.
Utilizamos internet como fuente de datos y extraemos la información que necesitas a medida para tus proyectos con procesos similares a los que utilizan los buscadores para escanear e indexar las páginas web.
Preguntas frecuentes sobre los datasets de Data Factory
Preguntas frecuentes sobre los datasets de Data Factory
¿Qué es Data Factory?
Es la creación de variables desde cero para explicar una realidad de tu negocio, poder descubrir nuevos insights y monetizar mejor tu data. La generación se realiza por la relación de múltiples fuentes como open data, internet y datos propios.
Si quieres crear una base de datos a medida de tus necesidades con Data Factory contacta con nosotros
Crea una base de datos a medida de tus necesidades
Si necesitas cualquier tipo de información o asesoramiento sobre nuestros servicios de Deyde DataCentric, contacta con nosotros y te ayudaremos encantados.