{"id":4912,"date":"2020-09-17T14:28:46","date_gmt":"2020-09-17T14:28:46","guid":{"rendered":"https:\/\/bluetab.net\/?p=4912"},"modified":"2020-09-17T14:28:46","modified_gmt":"2020-09-17T14:28:46","slug":"deteccion-de-fraude-bancario-con-aprendizaje-automatico","status":"publish","type":"post","link":"https:\/\/bluetab.co.uk\/en\/2020\/09\/deteccion-de-fraude-bancario-con-aprendizaje-automatico\/","title":{"rendered":"Detecci\u00f3n de Fraude Bancario con aprendizaje autom\u00e1tico"},"content":{"rendered":"<h1>Detencci\u00f3n de fraude bancario con aprendizaje autom\u00e1tico<\/h1>\n<figure><a href=\"https:\/\/www.linkedin.com\/company\/bluetab-solutions\/?viewAsMember=true\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" width=\"300\" height=\"300\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/10\/avatarP-bluetab.jpg.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/10\/avatarP-bluetab.jpg.png 300w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/10\/avatarP-bluetab.jpg-150x150.png 150w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/10\/avatarP-bluetab.jpg-75x75.png 75w\" sizes=\"(max-width: 300px) 100vw, 300px\"><\/a><\/figure>\n<h4><a href=\"https:\/\/www.linkedin.com\/company\/bluetab-solutions\/?viewAsMember=true\" target=\"_blank\" rel=\"noopener\">Bluetab<\/a><\/h4>\n<p>Share on twitter<br \/>\nShare on linkedin<\/p>\n<p>El sector \ufb01nanciero se encuentra en la actualidad sumergido en una lucha contra el fraude bancario siendo uno de sus mayores retos. En el 2018, la banca espa\u00f1ola noti\ufb01c\u00f3 un aumento del 17,7% de las reclamaciones producidas por cobros o transacciones indebidas con respecto al a\u00f1o anterior y s\u00f3lo en 2017 hubo m\u00e1s de 123.064 fraudes online a empresas y particulares.<\/p>\n<p>La banca espa\u00f1ola est\u00e1 encarando la batalla contra el fraude desde un punto de vista tecnol\u00f3-gico. Actualmente en pleno proceso de digitaliza-ci\u00f3n, con inversiones que rondan los 4.000 millo-nes de euros anuales, est\u00e1 dedicando sus esfuer-zos en la adopci\u00f3n de nuevas tecnolog\u00edas como el Big Data y la Inteligencia Arti\ufb01cial. Con estas tecnolog\u00edas se pretende mejorar y automatizar distintos procesos donde se incluye la gesti\u00f3n y detecci\u00f3n del fraude.<\/p>\n<p>En \/bluetab estamos llevando a cabo distintas iniciativas dentro del marco tecnol\u00f3gico de Big Data e Inteligencia Arti\ufb01cial en el sector \ufb01nan-ciero. En el marco de nuestras&nbsp;<strong>iniciativas de \u201cAdvanced Analytics &amp; Machine Learning\u201d<\/strong>&nbsp;nos encontramos actualmente colaborando en&nbsp;<strong>proyectos de Seguridad y Fraude<\/strong>&nbsp;donde, gracias al uso del Big Data y la Inteligencia Arti\ufb01-cial, somos capaces de ayudar a nuestros clien-tes a crear modelos predictivos m\u00e1s precisos.<\/p>\n<p>Y,&nbsp;<strong>\u00bfc\u00f3mo el aprendizaje autom\u00e1tico puede ayudar a prevenir el fraude bancario?<\/strong>. Poniendo foco en las colaboraciones realizadas dentro del \u00e1rea de Fraude, \/bluetab afronta este tipo de iniciativas partiendo de una serie de transferencias identi\ufb01cadas como fraude y de un set de datos con las sesiones de los usuarios en la banca electr\u00f3nica. El reto consiste en generar un modelo capaz de predecir cu\u00e1ndo una sesi\u00f3n puede ser fraudulenta poniendo el \u201ctarget\u201d en los falsos positivos y negativos que el modelo pueda producir.<\/p>\n<blockquote><p>\n\t\t\t\tLa comprensi\u00f3n del negocio y de los datos es de gran importancia para realizar una correcta modelaci\u00f3n<\/p><\/blockquote>\n<p>Para la resoluci\u00f3n de este tipo de retos tecnol\u00f3gicos, hemos observado c\u00f3mo&nbsp;<strong>el uso de una meto-dolog\u00eda es de vital importancia<\/strong>&nbsp;para poder encarar estos retos. En \/bluetab hacemos uso de una&nbsp;<strong>adaptaci\u00f3n in-house y \u201cad-hoc\u201d para Banca de la metodolog\u00eda CRISP-DM<\/strong>&nbsp;en la cual distinguimos las siguientes fases:<\/p>\n<ul>\n<li>Comprensi\u00f3n del negocio<\/li>\n<li>Comprensi\u00f3n de los datos<\/li>\n<li>Calidad de los datos<\/li>\n<li>Construcci\u00f3n de predictores inteligentes<\/li>\n<li>Modelaci\u00f3n<\/li>\n<\/ul>\n<p>Consideramos que en los proyectos de detecci\u00f3n de Fraude Online&nbsp;<strong>la comprensi\u00f3n del negocio y de los datos es de gran importancia para realizar una correcta modelaci\u00f3n.<\/strong>&nbsp;Un buen an\u00e1lisis de los datos nos permite poder observar c\u00f3mo \u00e9stos est\u00e1n relacionados con la variable objetivo (el fraude), as\u00ed como otros aspectos estad\u00edsticos (distribuci\u00f3n de los datos, b\u00fasqueda de outliers, etc.) de no menor importancia. En estos an\u00e1lisis se puede observar la existencia de&nbsp;<strong>variables con gran capacidad predictiva las cuales denominamos \u201cvariables diamante\u201d<\/strong>. Atributos como: el n\u00famero de visitas a la web, el dispositivo utilizado para la conexi\u00f3n, el sistema operativo o el navegador utilizado para la sesi\u00f3n (entre otras), suelen encontrarse fuertemente relacionadas con el fraude bancario. Adem\u00e1s, el estudio de estas variables nos dice que, de manera individual, pueden llegar a reunir m\u00e1s del 90% de las transacciones fraudulentas. Es decir, el an\u00e1lisis y la comprensi\u00f3n del negocio y los datos, permite evaluar la mejor forma de plantear una soluci\u00f3n sin vernos perdidos en un mar de datos.<\/p>\n<p>Una vez se tiene el conocimiento del negocio y de los datos y tras haber obtenido aquellas varia-bles con mayor poder predictivo, es&nbsp;<strong>imprescindible contar con herramientas y procesos que aseguren la calidad de estas variables<\/strong>. Es indispensable realizar los entrenamiento de los modelos predictivos con variables y&nbsp;<strong>datos hist\u00f3ricos \ufb01ables<\/strong>. Un entrenamiento con variables de baja calidad podr\u00eda dar lugar a modelos err\u00e1ticos con gran impacto dentro del negocio.<\/p>\n<p>Tras asegurar la \ufb01abilidad de las variables predictoras seleccionadas, la siguiente etapa pasa por&nbsp;<strong>construir variables predictoras inteligentes<\/strong>. Estas variables seleccionadas en los pasos anteriores, a\u00fan teniendo una fuerte relaci\u00f3n con la variable a predecir (target) puede provocar ciertos problemas de comportamiento a la hora de realizar la modelaci\u00f3n, es por eso que es nece-sario un paso de preparaci\u00f3n de los datos. Esta preparaci\u00f3n de datos pasa por realizar ciertas adaptaciones a las variables para poder ser utilizada dentro del algoritmo, como puede ser el&nbsp;<strong>tratamiento de nulos o el tratamiento de variables categ\u00f3ricas<\/strong>. Adicionalmente, se debe realizar un&nbsp;<strong>tratamiento correcto de los outliers identi\ufb01cados<\/strong>&nbsp;en los pasos previos, para no incluir informaci\u00f3n que pueda distorsionar el modelo.<\/p>\n<p>De la misma manera, con el objetivo de \u201ca\ufb01nar\u201d el resultado, es de vital importancia aplicar distintas&nbsp;<strong>transformaciones a las variables para mejorar el valor predictivo del modelo<\/strong>. Transformaciones matem\u00e1ticas b\u00e1sicas como la exponencial, la logar\u00edtmica o la estandarizaci\u00f3n, junto con transformaciones m\u00e1s complejas como la WoE permiten poder mejorar de manera nota-ble la calidad de los modelos predictivos gracias al uso de variables m\u00e1s trabajadas facilitando la tarea al modelo.<\/p>\n<p>Por \u00faltimo,&nbsp;<strong>la etapa de modelaci\u00f3n se centra en enfrentar distintos tipos de algoritmos<\/strong>&nbsp;con distintas con\ufb01guraciones de hiperpar\u00e1metros para obtener aqu\u00e9l modelo que genere una mejor predicci\u00f3n. Aqu\u00ed es donde&nbsp;<strong>herramientas como Spark nos ayudan en gran medida<\/strong>, al poder realizar entrenamientos de distintos algoritmos y con\ufb01guraciones de manera r\u00e1pida, gracias a la programaci\u00f3n distribuida.<\/p>\n<p>Para la sostenibilidad de su aplicaci\u00f3n y evitar la obsolescencia del modelo,&nbsp;<strong>esta metodolog\u00eda se debe ir siguiendo de manera mensual<\/strong>&nbsp;en cada caso de uso y m\u00e1s a la hora de encarar una iniciativa como es el fraude bancario. Esto se debe a que pueden aparecer nuevas formas de fraude que no est\u00e9n contempladas en los modelos entrenados. Por ello es importante tener entendimiento y seleccionar adecuadamente las variables con las que reentrenar los modelos, para que no se queden obsoletos con el tiempo, lo que podr\u00eda perjudicar gravemente al negocio.<\/p>\n<p>En de\ufb01nitiva,&nbsp;<strong>una buena metodolog\u00eda de trabajo es vital<\/strong>&nbsp;a la hora de enfrentarse a problemas dentro del mundo de la Inteligencia Arti\ufb01cial y Advanced Analytics, siendo esenciales las fases de comprensi\u00f3n del negocio y de los datos. Siendo un \u201cmust\u201d en la actualidad el disponer de&nbsp;<strong>herramientas internas especializadas<\/strong>&nbsp;que permitan ejecutar este tipo de proyectos en pocas semanas, generando quick wins en nues-tros clientes y sus negocio<\/p>\n<h5>\u00bfQuieres saber m\u00e1s de lo que ofrecemos y ver otros casos de \u00e9xito?<\/h5>\n<p><a href=\"\/\" role=\"button\"><br \/>\nDESCUBRE BLUETAB<br \/>\n<\/a><br \/>\nShare on twitter<br \/>\nShare on linkedin<\/p>\n<p><b>SOLUCIONES, <\/b>SOMOS EXPERTOS<\/p>\n<p><a href=\"\/soluciones\/data-strategy\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-strategy\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-strategy\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-strategy\/\"><\/p>\n<h5>\n\t\t\t\t\t\tDATA STRATEGY<\/h5>\n<p><\/a><a href=\"\/soluciones\/data-strategy\/\"><\/a><a href=\"\/soluciones\/data-strategy\/\"><\/a><a href=\"\/soluciones\/data-strategy\/\">\t\t\t\t\t\t<\/a><br \/>\n<a href=\"\/soluciones\/data-fabric\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-fabric\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-fabric\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-fabric\/\"><\/p>\n<h5>\n\t\t\t\t\t\tDATA FABRIC<\/h5>\n<p><\/a><a href=\"\/soluciones\/data-fabric\/\"><\/a><a href=\"\/soluciones\/data-fabric\/\"><\/a><a href=\"\/soluciones\/data-fabric\/\">\t\t\t\t\t\t<\/a><br \/>\n<a href=\"\/soluciones\/augmented-analytics\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/augmented-analytics\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/augmented-analytics\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/augmented-analytics\/\"><\/p>\n<h5>\n\t\t\t\t\t\tAUGMENTED ANALYTICS<\/h5>\n<p><\/a><a href=\"\/soluciones\/augmented-analytics\/\"><\/a><a href=\"\/soluciones\/augmented-analytics\/\"><\/a><a href=\"\/soluciones\/augmented-analytics\/\">\t\t\t\t\t\t<\/a><\/p>\n<p>Te puede interesar<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Detencci\u00f3n de fraude bancario con aprendizaje autom\u00e1tico Bluetab Share on twitter Share on linkedin El sector \ufb01nanciero se encuentra en la actualidad sumergido en una lucha contra el fraude bancario siendo uno de sus mayores retos. En el 2018, la banca espa\u00f1ola noti\ufb01c\u00f3 un aumento del 17,7% de las reclamaciones producidas por cobros o transacciones [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":20759,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_header_footer","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[7,18],"tags":[],"class_list":["post-4912","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog-es","category-tendencias"],"acf":[],"jetpack_featured_media_url":"https:\/\/bluetab.co.uk\/wp-content\/uploads\/2020\/10\/fraude-II.jpg","_links":{"self":[{"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/posts\/4912","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/comments?post=4912"}],"version-history":[{"count":1,"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/posts\/4912\/revisions"}],"predecessor-version":[{"id":20734,"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/posts\/4912\/revisions\/20734"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/media\/20759"}],"wp:attachment":[{"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/media?parent=4912"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/categories?post=4912"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bluetab.co.uk\/en\/wp-json\/wp\/v2\/tags?post=4912"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}