Link zu WSL Hauptseite Eidg. Forschungsanstalt für Wald, Schnee und Landschaft WSL
 
Projektdauer: 2004 -

Schätzung Holzernteproduktivitäten

Vergleich verschiedener Verfahren zur Schätzung von Produktivitätsgrössen bei der Holzernte

Einleitung

Die monetären oder zeitlichen Aufwände bei der Holzernte sind abhängig von verschiedenen Eingangsgrössen (Rückedistanz, Geländemerkmale, durchschnittliches Volumen der Bäume etc.). Sind die relevanten Eingangsgrössen sowie die Art und Weise ihres Einflusses auf die Aufwände bekannt, so können begründete Schätzungen für diese Aufwände abgegeben werden. Zur Schätzung können verschiedene Verfahren angewendet werden.

Multiple (lineare) Regression

Die multiple (lineare) Regression ist ein bekanntes und verlässliches statistisches Verfahren, um aus mehreren unabhängigen Eingangsvariablen eine abhängige Zielvariable ableiten zu können. Aus einer Menge an erhobenen Datensätzen wird dabei zuerst ein mathematisches Modell erstellt. In einem zweiten Schritt wird das Modell auf einen gegebenen Referenzdatensatz angewandt und ermöglich so eine Schätzung der abhängigen Zielgrösse.

Die Regression ist jedoch nur eines von mehreren möglichen alternativen Verfahren.

Das k-nächste Nachbarn-Verfahren

Eine Alternative zur multiplen linearen Regression ist beispielsweise das Verfahren der k nächsten Nachbarn (KNN).

In einer Menge von Datensätzen werden die zu einem gegebenen Referenzdatensatz k ähnlichsten Datensätze gesucht. Als Mass der Ähnlichkeit zwischen zwei Datensätzen wird oft die Euklidische Distanz zwischen den beiden Datensätzen eingesetzt. Anschliessend wird aus den bekannten abhängigen Variablen der k nächsten Nachbarn die unbekannte abhängige Variable des Referenzdatensatzes errechnet. Dabei kann beispielsweise die relative Nähe zum Referenzdatensatz zusätzlich als Gewicht in die Berechnung einfliessen.

Im Gegensatz zur Regression wird somit nicht aus einer vorhandenen Menge an Datensätzen ein statisches Modell erstellt, sondern es wird immer mit allen verfügbaren Datensätzen gearbeitet.

Genetischer Algorithmus

Der genetische Algorithmus (auch: evolutionärer Algorithmus) ist ein heuristisches Verfahren mittels welchem ebenfalls ein Schätzmodell erzeugt werden kann. Aus einer Population von eingangs zufällig erzeugten Schätzmodellen wird eine Anzahl an Individuen gewählt, welche am besten in der Lage sind, die abhängigen Variablen realer Datensätze vorherzusagen. Diese ausgewählten Individuen (die momentan "besten" Schätzmodelle) werden dann, in einer Analogie zur genetischen Auslese, miteinander "gekreuzt" und mutieren mit einer geringen Wahrscheinlichkeit in einer zufälligen Weise. Dadurch entsteht eine neue Population von Schätzmodellen, von welchen einige Individuen mit einer gewissen Wahrscheinlichkeit bessere Schätzmodelle abgeben als die besten der letzten Generation.

Wird dieser Vorgang nur lange genug wiederholt, so entstehen nach und nach immer bessere Schätzmodelle. Wenn die Qualität der Schätzmodelle ein gewünschtes Mass erreicht hat, wird das beste Modell ausgewählt. Damit kann nun die abhängige Variable des Referenzdatensatzes geschätzt werden.

Projektziele

Das Ziel des Projektes besteht darin, mögliche alternative Schätzverfahren für Produktivitätsgrössen von Holzernteverfahren auf ihre Eignung hin zu überprüfen und in Forschung und Praxis besser bekannt zu machen. Für ausgewählte Verfahren sollen Instrumente entwickelt werden, die von Forschung und Praxis genutzt werden können.

KNN-Tool für Excel 2007

Momentan wird für Excel 2007 ein Tool entwickelt, mittels welchem sich auf komfortable Weise KNN-Berechnungen durchführen lassen.

Kontakt
Stichworte Holzernteproduktivität, k nächste Nachbarn, KNN, genetischer Algorithmus, multiple lineare Regression, Schätzverfahren