¡Bienvenidos al foro de RapidMiner en Castellano!

rfuentealba · September 2018

¡Hola a todos los usuarios de la comunidad!

Este foro es para los usuarios hispanoparlantes de RapidMiner. Sean bienvenidos. Este es un foro para que los nuevos usuarios puedan leer y aprender sobre RapidMiner, y para que los usuarios experimentados puedan ayudar a quienes, como ustedes, comenzaron a usar a RapidMiner.

NOTA PARA LOS NUEVOS USUARIOS: Es altamente probable que otra persona haya hecho una pregunta similar a las que ustedes tuvieron, o algún problema al iniciarse. No es necesario buscar en el foro en inglés, pero sí buscar por algunas palabras claves en castellano podría ayudarnos bastante. Cuando escriban una pregunta, por favor consideren agregar lo siguiente a su artículo:

Escribir una descripción clara y concisa de su problema.
Adjuntar el proceso en RapidMiner en XML. Es posible pegarlo aquí con el botón </> en la barra de herramientas.
Adjuntar los datos, si es que éstos pueden ser compartidos públicamente, por supuesto.
Adjuntar capturas de pantalla o screenshots, los que sea necesario.
Si es necesario hacer referencia a otros usuarios en este foro, es posible hacerlo usando la arroba @ como prefijo, seguida del nombre de usuario.

NOTA PARA LOS USUARIOS EXPERIMENTADOS: Gracias por escribir en este foro. Agradecemos enormemente su ayuda para iniciar a otras personas. Por favor, consideren que las personas que escriben aquí son usuarios nuevos en su mayoría y tienen preguntas que corresponden a usuarios nuevos. Por favor, mantengan esto presente, ya que ustedes también fueron novatos alguna vez.

Quien les escribe es @rfuentealba, que administrará este grupo de interés especial (SIG, por las siglas en inglés de Special Interest Group). Siéntanse libres de escribirme si necesitan apoyo. La comunidad de RapidMiner en Castellano la hacemos todos. :smileyhappy:

Un abrazo enorme,

jreinoso · September 2018

Excelente iniciativa.. Alguno sabe cuántos somos?

jaime

raul_canay · September 2018

Hola,

pues somos... ¿pocos pero selectos?

rfuentealba · September 2018

¡Hola!

Entre las personas que conozco y que sé que han leído el foro, y ustedes que han comentado, somos alrededor de 20 personas en (por orden alfabético): Argentina, Chile, Colombia, España, Estados Unidos, México, Panamá y Perú.

Haré una entrada para que podamos presentarnos, y poder tener una catástrofe un catastro para saber cuántos somos. ¿Les parece? Difundan entre sus amigos y disfruten.

Un abrazo desde Chile,

dstamato · October 2018

Que buena noticias! Felicitaciones. Buenos Aires, Argentina

Diego Stamato

carlos_ramos · December 2018

Estupendo, buena iniciativa. Aunque me manejo con el inglés, siempre es bueno encontrar ayuda en tu idioma.

jonathan_tayupa · January 2019

Saludos desde Ecuador, estoy incursionando con esta herramienta y quisiera saber si es posible llevar a cabo una integración entre rapidminer y un lenguaje de desarrollo?

rfuentealba · January 2019

@jonathan_tayupa por defecto, hay integraciones en Python y R, y es posible escribir tus propios scripts en Groovy además de ello. Puedes escribir esto como una pregunta nueva, y agregar como etiqueta "RapidMiner en Castellano", ¿te parece?

MarcoBarradas · February 2019

@jonathan_tayupa como complemento a la respuesta de Rodrigo te comento que una vez que has creado tu proceso es posible exponer el proceso vía WS a través del RM Server. Con el server puedes exponer el servicio para que sea consumido vía cURL y podrías crear cualquier solución que sea necesaria.

Saludos

roberto_rojas_r · March 2019

señores, una pregunta de principiante, estoy procesando unos datos en KNN y necesito saber como configurar el proceso para que me funcione. Quiero utilizarlo para medir distancia entre un usuario objetivo y los usuarios vecinos cercanos. Tengo el identificador del usuario, los ítems revisados y las calificaciones de cada ítem por usuario. entiendo que KNN sólo permite variables numéricas. Me pueden explicar como configurar un proceso que me ayude con esto?

rfuentealba · March 2019

Hola @roberto_rojas_r, bienvenido a la comunidad!

¿Te molesta si te pido que escribas esta pregunta como una pregunta nueva? Para ello haz click aquí, y escribe tu pregunta en castellano, con el tag RapidMiner en Castellano.

Así podemos tener una conversación completa dedicada a tu problema y diferentes opiniones.

Saludos y bienvenido nuevamente,

Rodrigo.

vsantosp · June 2019

Hola! Gracias por hacer un foro en Español

Estoy teniendo problemas para poner preguntas, alguien sabria solucionarmelo?

Muchas gracias

kansta · June 2019

Buenas quiero crear un grafico de burbujas lineal para registrar mi actividad deportiva de tres deportes cada día, cada burbuja sería más grande según el tiempo dedicado. Se puede realizar en esta aplicación? Gracias, es urgente.

rene27791 · August 2019

Hola a todos, saludos desde Panamá.

Lolitaminer · August 2019

Hola!!! Saludos desde Bolivia!

Xtint0 · September 2019

Hola.. Soy médico y tecnólogo. Estoy aquí para aprender a utilizar RapidMiner. Saludos desde México.

MarcoBarradas · September 2019

@Xtint0 bienvenido al grupo. Con gusto te ayudo en lo que necesites. Yo también soy Mexicano

Maikel · September 2019

Hola rfuntealba sabras de una casa de estudios en Peru que brinde certificacion de basico a avanzado sobre rapidminer me interesa mucho.

Sld Miguel P.

diego_cruz · February 2020

Muchas gracias, poor su bienvanida soy nuevo les escribo desde ibague - tolima - Colombia

MiguelHH98 · March 2020

Hola!
Tengo una consulta: Estoy trabajando en un proyecto en el cual necesito predecir el valor de una variable en función a otras que en conjunto forman parte de una base de datos, la cual, a su vez, estoy utilizando como input en el programa. Para ello, La herramienta o método que uso en Rapidminer es el de automodelación (Automodel). Todo bien al correr el modelo. El algoritmo que salió como el mejor fue Gradient Boosted Trees, así que me enfoqué en ese. Una vez ahí, en la pestaña Pesos (Weights) ciertas variables (supongamos "a", "b"y "c") me salieron como las más influyentes o de mayor importancia. Hasta ahí todo en orden; luego fui a la pestaña Simulador (Simulator) justamente para observar como es que estas variables afectaban al valor de mi variable meta (digamos que "y"). No obstante, el valor se mantuvo intacto. Intenté con las demás variables que eran menos influyentes para ver si alguna impactaba en "y". Mientras hacía esta prueba, me topé con dos variables ("m" y "n") que sí modificaban el valor de "y" pero lo que me pareció extraño fue que ninguna de las dos era tan influyente como "a", "b" o "c". Otra cosa que observé y me pareció curioso fue que en la pestaña "Production Model" la mayoría de los árboles presentaba como cabeceras a estas dos variables "m" y "n", mas no sé que puedo concluir a partir de ello. Por favor, quisiera que alguien me explique por qué ocurre esto o cuál es la verdadera lógica en cuanto al impacto de los pesos en la predicción y por qué ciertas variables que no son casi nada influyentes sí causan un impacto. Espero puedan ayudarme. Gracias de antemano.

Saludos,

Miguel Hinostroza

MarcoBarradas · March 2020

Hola @MiguelHH98 ya que no puedo ver imágenes de tu modelo y de los resultados (imagino que por temas de confidencialidad) te recomiendo utilizar el operador Local Interpretation este te permitirá ver caso por caso qué rama del árbol fue utilizada para clasificar cada registro y posiblemente con eso puedas ver qué atributos y valores de los mismos están influyendo en la clasificación.
Para poderte ayudar un poco más valdría la pena pegar algunas imágenes de lo que te sale en automodel. Si quieres mantener el anonimato de tus columnas utiliza el operador rename by generic name con eso ya no podremos conocer el nombre de tus columnas y así perderemos el contexto de las variables y nos podremos enfocar en lo que te arroja el sistema.

Saludos y espero haber ayudado un poco en tu pregunta.

Saludos.

MiguelHH98 · April 2020

Hola, @MarcoBarradas

Muchas gracias por responder. Ya no llegué a leer tu mensaje, pero felizmente pude aclarar mis dudas. Cualquier otra consulta la estaré comentando por aquí. Gracias de nuevo.

Saludos.

guillermopozop · April 2020

Estimados:
Junto con saludar a todos, me gustaría solicitar su ayuda con ejercicio.
@rfuentealba favor si pudieras ayudarme con algunas indicaciones te lo agradecería muchísimo.
Necesito predecir las ventas para mis clientes. Tengo un excel con cuatro campos:
FECHA -> formato DD-MM-YYYY
DIA_SEMANA -> indica si que día es la fecha de lunes a viernes
NOMBRE_CLIENTE -> Indica el nombre del cliente
UNIDADES_VENDIDAS -> cantidad de unidades que compro un cliente en una fecha especifica

Mi pregunta es como puedo generar una predicción de ventas para las fechas futuras que no están en el excel.
La idea es que la predicción que arroje devuelva los mismos cuatro campos que ingrese pero con fechas futuras

El ejemplo es este:

FECHA	DIA_SEMANA	NOMBRE_CLIENTE	UNIDADES_VENDIDAS
01-01-2020	3	1	18
02-01-2020	4	1	19
03-01-2020	5	1	17
04-01-2020	6	1	3
05-01-2020	7	1	4
06-01-2020	1	1	16
07-01-2020	2	1	19
08-01-2020	3	1	22
09-01-2020	4	1	19
10-01-2020	5	1	17
11-01-2020	6	1	Predicción
12-01-2020	7	1	Predicción
13-01-2020	1	1	Predicción
14-01-2020	2	1	Predicción
15-01-2020	3	1	Predicción

La idea es que ingresando ventas del 01 al 10 de enero pueda predecir hasta el 15 de enero.

PD: Soy nuevo en RapidMiner favor agradecería me indicaran que procesos debo concatenar desde eñ ReadExcel hasta el CriteCSV final con los valores de predicción.

Desde ya muchas gracias.

Saludos a todos!

MarcoBarradas · April 2020

Hola @guillermopozop estás buscando hacer un problema de serie de tiempo ya que buscas predecir más de un valor en el futuro.
De inicio valdría la penar tener más datos para poder predecir 5 días en el futuro. Al menos deberías de tener 15 días previos.
Deberías de hacer un proceso que arroje una serie de tiempo por cada cliente con eso sólo usarías 2 atributos la fecha y el valor de la venta y con eso podrías pronosticar el valor en los siguientes días.

Aquí está el acceso al tutorial de RM para series de tiempo.
https://academy.rapidminer.com/learn/course/time-series-analytics/time-series-analytics/data-preparation-and-analysis

El otro camino sería hacer una regresión basada en las columnas que tienes pero los valores futuros después del primer pronóstico dependerían de la certeza del dato que pronosticaste primero.

Saludos una vez que hayas visto el tutorial de serie de tiempo con gusto te puedo intentar ayudar a construir tu modelo.

Monicafontal · May 2020

Hola

Tenemos un problema y no sabemos cómo resolverlo. Adjunto la imagen. @rfuentealba

Image: https://us.v-cdn.net/6030995/uploads/editor/b1/gjdsr1gyr01d.jpg

Estamos haciendo la estimación de la variable objetivo con respecto al modelo. Pero no entendemos qué es lo que está fallando.

Gracias!

rfuentealba · May 2020

Buen día Mónica,

Tienes problemas con los títulos. Cuando entrenaste el algoritmo "ReloadScore..." (por lo que veo en tu pantalla), lo entrenaste con un atributo llamado "PROGRAMA = MUSICA".

Probablemente hayas tenido, dentro de tu entrenamiento, algo llamado "One Hot Encoding", que lo que hace es cambiar esto:

ID, PROGRAMA, OTROCAMPO<br>1, MÚSICA, MUS123<br>2, MÚSICA, MUS234<br>3, MATEMÁTICA, MAT123<br>4, MATEMÁTICA, MAT234<br>5, CASTELLANO, CAS123

A esto:

ID, PROGRAMA = MÚSICA, PROGRAMA = MATEMÁTICA, PROGRAMA = CASTELLANO, OTROCAMPO<br>1, 1, 0, 0, MUS123<br>2, 1, 0, 0, MUS234<br>3, 0, 1, 0, MAT123<br>4, 0, 1, 0, MAT234<br>5, 0, 0, 1, CAS123

Si es que es eso (no he visto el programa de entrenamiento de tu algoritmo), entonces antes de "Apply Model", deberías poner el operador Nominal to Numerical.

Eso hace exactamente lo mismo.

Como consejos:

1.- Cuando escribas preguntas acá, escríbelas en castellano, pero en su propio párrafo. Así tenemos formas de seguir un hilo.

2.- Cuando crees procesos en los que antes de entrenar se modifican los datos, lleva todas las modificaciones a un subproceso, porque el entrenamiento sólo se hace con los datos como están al final de este proceso y no se toman en cuenta las modificaciones que sufrieron durante el proceso.

Disculpa la demora, he estado un poco perdido de todo. Un abrazo!

Saludos,

Rodrigo.

David_Franco · May 2020

hola, gracias soy nuevo en la comunidad. tengo una duda. El programa aun sigue siendo gratis con bases hasta 10000 registros o solo es prueba de 30 días gratis?

rfuentealba · May 2020

¡Hola @David_Franco, bienvenido a la comunidad!

Te comento, RapidMiner Studio tiene una prueba de 30 días a capacidad full, luego de los 30 días puedes continuar con las limitaciones de 10.000 registros que mencionas, que corresponde a RapidMiner Studio Free.

No está demás recordar que si deseas adquirir las versiones Professional o Enterprise de RapidMiner Studio y eres de Sudamérica, pueden contactarme mediante un mensaje directo aquí mismo en la plataforma.

Saludos cordiales,

Rodrigo

Antoniomuz · February 2021

Hola, tengo una duda al usar RapidMinder, después de subir el fichero csv con la función read Csv, y luego utilizo la fórmula select attributes y en el área de parameters no me salen las opciones de seleccionar ninguna columna o atributo. ¿A qué se debe? Imagen de duda

ceaperez · March 2021

Hola Antonio,
te recomiendo que utilices mejor la función Import Data, que encontraras en la parte superior izquierda. con esta función puedes importar y tratar los datos y desde luego tener mapeados los atributos.

Un saludo

rfuentealba · March 2021

Hola,

¿Soy yo o la imagen no se ve? En cualquier caso:

Si el CSV tiene como cabecera el nombre de cada columna, debes configurar el lector de CSV para que lea esto. De otra forma, tendrás que configurarlo antes:

Image: https://us.v-cdn.net/6030995/uploads/editor/yh/bxcg01agnf3q.png

En la siguiente imagen salen marcadas 3 flechas:

1.- Revisa siempre eso, es la causa de mis peores pesadillas cuando he debido importar CSV's.
2.- Los cambios de configuraciones deberían dar origen a una tabla como esta.
3.- Si tiene header, seleccionas esto; si no, te dará la opción de darles nombres a las columnas.

Image: https://us.v-cdn.net/6030995/uploads/editor/lp/ikf064bofse4.png

Otro tip:

En la parte final, si no necesitas todo el CSV, no es necesario que importes todas las columnas. Hay un menú que te permite configurar exactamente qué traer. Así te ahorras un "Select Attributes" en el proceso.

Image: https://us.v-cdn.net/6030995/uploads/editor/0x/ak4j4w2y5nay.png

Una vez hecho este proceso, no deberías tener problemas:

Saludos,

Rodrigo.

Howdy, Stranger!

Quick Links

Categories

Altair RapidMiner Community

GET HELP. LEARN BEST PRACTICES. NETWORK WITH YOUR PEERS.

¡Bienvenidos al foro de RapidMiner en Castellano!

Comments