The Altair Community is migrating to a new platform to provide a better experience for you. In preparation for the migration, the Altair Community is on read-only mode from October 28 - November 6, 2024. Technical support via cases will continue to work as is. For any urgent requests from Students/Faculty members, please submit the form linked here
Minimal gain value
MonikaBeee
Member Posts: 6 Learner II
Hi guys,
Someone could please help me in my homework?
I need to use a csv file to make a process based on a decision tree model. Then the question is: what is the largest minimal gain value where the C4.5 tree has not got only one leaf?
Thanks in advance!
Monika
Someone could please help me in my homework?
I need to use a csv file to make a process based on a decision tree model. Then the question is: what is the largest minimal gain value where the C4.5 tree has not got only one leaf?
Thanks in advance!
Monika
0
Best Answers
-
BalazsBarany Administrator, Moderator, Employee-RapidMiner, RapidMiner Certified Analyst, RapidMiner Certified Expert Posts: 955 UnicornHi @MonikaBeee,
you could import your CSV file into the repository, or use Read CSV to read the data on the file in the process.
You should mark the label attribute using Set Role.
Then you let a Decision Tree build a model from your data.
For determining the minimal gain you could manually iterate (e. g. start from 0.4 and go down, or from 0.001 and go up), first in larger, then in smaller steps and look at the resulting until you find the threshold you're searching for. However, other parameter settings could also influence the result.
A more elegant way is using a loop to automatically try different parameter values and determining the tree complexity. For example there is Decision Tree to ExampleSet in the Converters extension that you could use to find the number of rules in the tree and then filter the appropriate lines.
Regards,
Balázs5 -
BalazsBarany Administrator, Moderator, Employee-RapidMiner, RapidMiner Certified Analyst, RapidMiner Certified Expert Posts: 955 UnicornIgen ;-)5
-
BalazsBarany Administrator, Moderator, Employee-RapidMiner, RapidMiner Certified Analyst, RapidMiner Certified Expert Posts: 955 UnicornSzia!
Itt nem szoktunk házi feladatot megoldani, hanem olyan kérdésekre válaszolunk, amikben a dokumentáció és az elérhetô anyagok nem segítenek. Ajánlom az https://academy.rapidminer.com fölkeresését, ott megnézel néhány videót, és utána érteni fogod, amit írtam.
Ha utána még kérdésed van, szóljál. Nem csak én vagyok magyarul tudó rapidmineres, a fejlesztô csapat egy része magyar.
Üdv,
Balázs5 -
BalazsBarany Administrator, Moderator, Employee-RapidMiner, RapidMiner Certified Analyst, RapidMiner Certified Expert Posts: 955 UnicornIgen, de külsôs vagyok, és Bécsben élek.5
Answers
Are you hungarian by any chance?
Because I'm so it would be easier to communicate in hungarian if you don't mind
Best regards,
M
Szóval a helyzet az, hogy üzleti intelligencia kurzuson van hetene egy feladatsor amit rapidminerbe kell megoldani. Számomra ez nagyon nehéz, amikor volt olyan kérdés ami excelbe is megoldható volt, arra tudtam csak pontot szerezni.
Valójában semmit nem tudok a szoftver kezeléséről, most odáig jutottam el, hogy megnyitottam (beolvastam) a csv fájlt (processt?) a programba. Szóval nekem lépésről lépésre el kellene magyarázni, hogy pontosan mit kell csinálnom...
Ez a feladat magyarul:
A Bankmarketing esettanulmányhoz tartozó diák a teljes bank-full.csv adathalmaz felhasználásával készültek, ami nem biztos hogy minden gépen le tud futni. Ezért a feladat megválaszolásához a kisebbik bank.csv állományt használva állítsuk elő a diasor 11. oldalán található döntési fa modellen alapuló processt. (Az indukció és dedukció idejét nem szükséges megmérni a Log dobozzal.) A döntési fa alapértelmezett beállításai mellett melyik az a legnagyobb minimal gain érték, amire a kapott C4.5 fa nemcsak egyetlen levélből áll?
(A választ három tizedes jegy pontossággal kell megadni.)
Amúgy te akkor a cégnek dolgozol?