¡Bienvenidos al foro de RapidMiner en Castellano!
¡Hola a todos los usuarios de la comunidad!
Este foro es para los usuarios hispanoparlantes de RapidMiner. Sean bienvenidos. Este es un foro para que los nuevos usuarios puedan leer y aprender sobre RapidMiner, y para que los usuarios experimentados puedan ayudar a quienes, como ustedes, comenzaron a usar a RapidMiner.
NOTA PARA LOS NUEVOS USUARIOS: Es altamente probable que otra persona haya hecho una pregunta similar a las que ustedes tuvieron, o algún problema al iniciarse. No es necesario buscar en el foro en inglés, pero sí buscar por algunas palabras claves en castellano podría ayudarnos bastante. Cuando escriban una pregunta, por favor consideren agregar lo siguiente a su artículo:
- Escribir una descripción clara y concisa de su problema.
- Adjuntar el proceso en RapidMiner en XML. Es posible pegarlo aquí con el botón </> en la barra de herramientas.
- Adjuntar los datos, si es que éstos pueden ser compartidos públicamente, por supuesto.
- Adjuntar capturas de pantalla o screenshots, los que sea necesario.
- Si es necesario hacer referencia a otros usuarios en este foro, es posible hacerlo usando la arroba @ como prefijo, seguida del nombre de usuario.
NOTA PARA LOS USUARIOS EXPERIMENTADOS: Gracias por escribir en este foro. Agradecemos enormemente su ayuda para iniciar a otras personas. Por favor, consideren que las personas que escriben aquí son usuarios nuevos en su mayoría y tienen preguntas que corresponden a usuarios nuevos. Por favor, mantengan esto presente, ya que ustedes también fueron novatos alguna vez.
Quien les escribe es @rfuentealba, que administrará este grupo de interés especial (SIG, por las siglas en inglés de Special Interest Group). Siéntanse libres de escribirme si necesitan apoyo. La comunidad de RapidMiner en Castellano la hacemos todos. :smileyhappy:
Un abrazo enorme,
Comments
Excelente iniciativa.. Alguno sabe cuántos somos?
jaime
Hola,
pues somos... ¿pocos pero selectos?
¡Hola!
Entre las personas que conozco y que sé que han leído el foro, y ustedes que han comentado, somos alrededor de 20 personas en (por orden alfabético): Argentina, Chile, Colombia, España, Estados Unidos, México, Panamá y Perú.
Haré una entrada para que podamos presentarnos, y poder tener una catástrofe un catastro para saber cuántos somos. ¿Les parece? Difundan entre sus amigos y disfruten.
Un abrazo desde Chile,
Que buena noticias! Felicitaciones. Buenos Aires, Argentina
Diego Stamato
Saludos
¿Te molesta si te pido que escribas esta pregunta como una pregunta nueva? Para ello haz click aquí, y escribe tu pregunta en castellano, con el tag RapidMiner en Castellano.
Así podemos tener una conversación completa dedicada a tu problema y diferentes opiniones.
Saludos y bienvenido nuevamente,
Rodrigo.
Sld Miguel P.
Tengo una consulta: Estoy trabajando en un proyecto en el cual necesito predecir el valor de una variable en función a otras que en conjunto forman parte de una base de datos, la cual, a su vez, estoy utilizando como input en el programa. Para ello, La herramienta o método que uso en Rapidminer es el de automodelación (Automodel). Todo bien al correr el modelo. El algoritmo que salió como el mejor fue Gradient Boosted Trees, así que me enfoqué en ese. Una vez ahí, en la pestaña Pesos (Weights) ciertas variables (supongamos "a", "b"y "c") me salieron como las más influyentes o de mayor importancia. Hasta ahí todo en orden; luego fui a la pestaña Simulador (Simulator) justamente para observar como es que estas variables afectaban al valor de mi variable meta (digamos que "y"). No obstante, el valor se mantuvo intacto. Intenté con las demás variables que eran menos influyentes para ver si alguna impactaba en "y". Mientras hacía esta prueba, me topé con dos variables ("m" y "n") que sí modificaban el valor de "y" pero lo que me pareció extraño fue que ninguna de las dos era tan influyente como "a", "b" o "c". Otra cosa que observé y me pareció curioso fue que en la pestaña "Production Model" la mayoría de los árboles presentaba como cabeceras a estas dos variables "m" y "n", mas no sé que puedo concluir a partir de ello. Por favor, quisiera que alguien me explique por qué ocurre esto o cuál es la verdadera lógica en cuanto al impacto de los pesos en la predicción y por qué ciertas variables que no son casi nada influyentes sí causan un impacto. Espero puedan ayudarme. Gracias de antemano.
Saludos,
Miguel Hinostroza
Para poderte ayudar un poco más valdría la pena pegar algunas imágenes de lo que te sale en automodel. Si quieres mantener el anonimato de tus columnas utiliza el operador rename by generic name con eso ya no podremos conocer el nombre de tus columnas y así perderemos el contexto de las variables y nos podremos enfocar en lo que te arroja el sistema.
Saludos y espero haber ayudado un poco en tu pregunta.
Saludos.
Muchas gracias por responder. Ya no llegué a leer tu mensaje, pero felizmente pude aclarar mis dudas. Cualquier otra consulta la estaré comentando por aquí. Gracias de nuevo.
Saludos.
Junto con saludar a todos, me gustaría solicitar su ayuda con ejercicio.
@rfuentealba favor si pudieras ayudarme con algunas indicaciones te lo agradecería muchísimo.
Necesito predecir las ventas para mis clientes. Tengo un excel con cuatro campos:
FECHA -> formato DD-MM-YYYY
DIA_SEMANA -> indica si que día es la fecha de lunes a viernes
NOMBRE_CLIENTE -> Indica el nombre del cliente
UNIDADES_VENDIDAS -> cantidad de unidades que compro un cliente en una fecha especifica
Mi pregunta es como puedo generar una predicción de ventas para las fechas futuras que no están en el excel.
La idea es que la predicción que arroje devuelva los mismos cuatro campos que ingrese pero con fechas futuras
El ejemplo es este:
La idea es que ingresando ventas del 01 al 10 de enero pueda predecir hasta el 15 de enero.
PD: Soy nuevo en RapidMiner favor agradecería me indicaran que procesos debo concatenar desde eñ ReadExcel hasta el CriteCSV final con los valores de predicción.
Desde ya muchas gracias.
Saludos a todos!
De inicio valdría la penar tener más datos para poder predecir 5 días en el futuro. Al menos deberías de tener 15 días previos.
Deberías de hacer un proceso que arroje una serie de tiempo por cada cliente con eso sólo usarías 2 atributos la fecha y el valor de la venta y con eso podrías pronosticar el valor en los siguientes días.
Aquí está el acceso al tutorial de RM para series de tiempo.
https://academy.rapidminer.com/learn/course/time-series-analytics/time-series-analytics/data-preparation-and-analysis
El otro camino sería hacer una regresión basada en las columnas que tienes pero los valores futuros después del primer pronóstico dependerían de la certeza del dato que pronosticaste primero.
Saludos una vez que hayas visto el tutorial de serie de tiempo con gusto te puedo intentar ayudar a construir tu modelo.
Tenemos un problema y no sabemos cómo resolverlo. Adjunto la imagen. @rfuentealba
Estamos haciendo la estimación de la variable objetivo con respecto al modelo. Pero no entendemos qué es lo que está fallando.
Gracias!
Tienes problemas con los títulos. Cuando entrenaste el algoritmo "ReloadScore..." (por lo que veo en tu pantalla), lo entrenaste con un atributo llamado "PROGRAMA = MUSICA".
Probablemente hayas tenido, dentro de tu entrenamiento, algo llamado "One Hot Encoding", que lo que hace es cambiar esto:
ID, PROGRAMA, OTROCAMPO<br>1, MÚSICA, MUS123<br>2, MÚSICA, MUS234<br>3, MATEMÁTICA, MAT123<br>4, MATEMÁTICA, MAT234<br>5, CASTELLANO, CAS123
A esto:
ID, PROGRAMA = MÚSICA, PROGRAMA = MATEMÁTICA, PROGRAMA = CASTELLANO, OTROCAMPO<br>1, 1, 0, 0, MUS123<br>2, 1, 0, 0, MUS234<br>3, 0, 1, 0, MAT123<br>4, 0, 1, 0, MAT234<br>5, 0, 0, 1, CAS123
Si es que es eso (no he visto el programa de entrenamiento de tu algoritmo), entonces antes de "Apply Model", deberías poner el operador Nominal to Numerical.
Eso hace exactamente lo mismo.
Como consejos:
1.- Cuando escribas preguntas acá, escríbelas en castellano, pero en su propio párrafo. Así tenemos formas de seguir un hilo.
2.- Cuando crees procesos en los que antes de entrenar se modifican los datos, lleva todas las modificaciones a un subproceso, porque el entrenamiento sólo se hace con los datos como están al final de este proceso y no se toman en cuenta las modificaciones que sufrieron durante el proceso.
Disculpa la demora, he estado un poco perdido de todo. Un abrazo!
Saludos,
Rodrigo.
Te comento, RapidMiner Studio tiene una prueba de 30 días a capacidad full, luego de los 30 días puedes continuar con las limitaciones de 10.000 registros que mencionas, que corresponde a RapidMiner Studio Free.
No está demás recordar que si deseas adquirir las versiones Professional o Enterprise de RapidMiner Studio y eres de Sudamérica, pueden contactarme mediante un mensaje directo aquí mismo en la plataforma.
Saludos cordiales,
Rodrigo
te recomiendo que utilices mejor la función Import Data, que encontraras en la parte superior izquierda. con esta función puedes importar y tratar los datos y desde luego tener mapeados los atributos.
Un saludo
¿Soy yo o la imagen no se ve? En cualquier caso:
Si el CSV tiene como cabecera el nombre de cada columna, debes configurar el lector de CSV para que lea esto. De otra forma, tendrás que configurarlo antes:
En la siguiente imagen salen marcadas 3 flechas:
1.- Revisa siempre eso, es la causa de mis peores pesadillas cuando he debido importar CSV's.
2.- Los cambios de configuraciones deberían dar origen a una tabla como esta.
3.- Si tiene header, seleccionas esto; si no, te dará la opción de darles nombres a las columnas.
Otro tip:
En la parte final, si no necesitas todo el CSV, no es necesario que importes todas las columnas. Hay un menú que te permite configurar exactamente qué traer. Así te ahorras un "Select Attributes" en el proceso.
Una vez hecho este proceso, no deberías tener problemas:
Saludos,
Rodrigo.