Unter Operationalisierung versteht man in der empirischen Sozialforschung
die Angabe von Korrespondenzregeln, d.h. ein Satz an Messanweisungen, mit
denen Sachverhalte zu einem interessierenden Phänomen beobachtet und
datentechnisch erfasst werden. Ob dies tatsächlich durch eine Beobachtung
im eigentlichen Sinne oder durch eine Selbstauskunft im Sinne einer
Befragung oder durch einen speziellen Test in einem Labor erfolgt, ist
dabei unerheblich. Wichtig ist vielmehr die Feststellung, dass sich
natürlich nur solche Sachverhalte überhaupt erfassen lassen, die man auch
tatsächlich beobachten kann. Eine Unterscheidung von Variablen in
manifeste und latente ist zunächst nur eine zweigeteilte Beschreibung von
möglichen Variablenarten, die allerdings einen so sehr übergeordneten
Rahmen besitzt, dass man wohl davon ausgehen kann, dass sie alle
möglichen Variablen beschreiben kann.
Doch für eine Messanweisung ist diese Einteilung nur insoweit nützlich, als dass man festhalten kann, dass natürlich nur manifeste Variablen überhaupt für eine Beobachtung zum Einsatz kommen können. Eine latente Variable kann schon wieder derart abstrakt sein, dass sie selbst wieder zu einem interessierenden Phänomen werden kann, welches sich nur durch eine eigene (Teil-)Untersuchung überhaupt erheben lassen kann. Dabei geht es nicht darum, dass man einen Variablenwert bspw. durch Verrechnung oder sonstige mathematische Verarbeitung (Gewichtung, Quotierung, Differenzbildung zu einem anderen Wert) ermittelt, sondern dass man sie tatsächlich direkt beobachten kann.
empirischen Relativen liegen können und wie man zu einer Messvorschrift kommen kann. Man kann verschiedene Phänomene nach ihrem Abstraktionsniveau unterscheiden. Dabei kommen auch Überlegungen ins Spiel, wie das Skalenniveau ist, welches man für die Messung eines solchen Phänomens verwenden muss. In der Abbildung sind an den beiden Achsen „Abstraktionsniveau“ und „Empirisches Relativ“ drei Beispiele für Phänomene, die bei der Untersuchung von Kunden oder Marktstruktur interessant sein könnten. Je höher das Abstraktionsniveau ist, desto komplexer ist es auch, sowohl eine Nominaldefinition zu finden wie auch eine geeignete Messvorschrift abzuleiten. Diese hängt zwar direkt mit der Nominaldefinition zusammen, doch die Komplexität der Messvorschrift steigt ebenfalls mit der Komplexität der Nominaldefinition, da normalerweise immer mehr Indikatoren und Beziehungen zwischen ihnen für die Festlegung, wie das Phänomen beschaffen sein soll, herangezogen werden müssen.

Verschiedene Möglichkeiten, für die genannten empirischen Relative auch passende Indikatoren zu finden, zeigt die Abbildung, in der nun in einer zweidimensionalen Ansicht insgesamt drei Dimensionen untergebracht sind. Unterhalb der drei Beispiel-Phänomene, die weiterhin nach ihrem Abstraktionsgrad grob vertikal angeordnet sind, befinden sich nun mögliche Indikatoren, mit denen sie gemessen werden könnten oder mit deren Kombinationen in Form einer Berechnungsvorschrift ihr Wert festgelegt werden kann. Wie man gut sehen kann, ist hier auch angegeben, dass bspw. für eine Bestellhäufigkeit ein einfacher zahlenmäßiger Abruf möglich ist, während für die Kundenkategorie schon Quoten, Gewichtungen oder Kombinationen von ihnen notwendig sind. Für die Kundenzufriedenheit schließlich gibt es gar keine solch einfachen Zahlen mehr, sondern muss man ausdrücklich nach Meinungen, Einstellungen und Verhaltensweisen fragen. Zum einen sieht man hier, dass man tatsächlich zusätzliche Daten erheben muss, die also nicht einfach aus dem schon vorhandenen Datenmaterial entnommen werden können, und dass dies darüber hinaus in Form einer direkten Befragung der Kunden bspw. in Form einer Stichprobe geschehen muss.

Wie schon die Überlegungen weiter oben gezeigt haben, ist die Anzahl möglicher Indikatoren sicherlich in den meisten Fällen sehr umfangreich. Ausschließlich die Nominaldefinition kann Klarheit schaffen, wobei nur in den Fällen, in denen für ein fast beliebiges Etikett Indikatoren herangezogen werden können, die Auswahl der Indikatoren vor dem Hintergrund erfolgen kann, welche Daten besonders einfach, praktikabel oder einfach zu erfahren sind.
Die Kundenzufriedenheit, die projektbezogen festgelegt wird, kann für Außenstehende verständlich und nachvollziehbar auch nur auf solchen Indikatoren wie positive Bewertungen, Bestellfrequenz oder Umsatzgröße fußen. Ob nun noch ein weiterer Indikator hinzukommt, der aus dem Bereich der Bestellaktivitäten stammt, oder einer entfällt, der sich für einen signifikant großen Teil der Stichprobe als nicht ermittelbar herausgestellt hat, oder ob Gewichtungen eingeführt werden, ist für das einzelne Projekt weniger bedeutend. Selbstverständlich sind dies Punkte, die bei Projektvergleichen in der Zeit und über Untersuchungen hinweg sehr wohl eine Rolle spielen. Grundsätzlich ist man allerdings in seiner Entscheidung frei. Völlig unsinnige Indikatoren sollen hier natürlich außen vor bleiben.
Dies zeigt auch die Abbildung, welche mit verschiedenen Alternativen nur allein für die Kundenzufriedenheit zeigt, dass man aus einem ganzen Blumenstrauß an denkbaren Indikatoren wählt und diese auch einzeln, in Kombination gewichtet oder ungewichtet sinnvoll für die Ermittlung von Kundenzufriedenheit sein können.

Empirische Relative, die allerdings selbst wieder schon soweit durch die herrschende Meinung definiert sind, dass ein anderes Verständnis des sie beschreibenden Begriffs als unseriös, irreführend oder sogar falsch empfunden würde, erlauben solche Freiräume nicht. Dies gilt dann umso mehr, wenn die Ergebnisse einer Studie bspw. in der Werbung benutzt werden und dabei zwangsläufig der zu Grunde liegenden Nominaldefinition nicht ausreichend Platz eingeräumt wird. Vielleicht lässt es sich gerade im betriebswirtschaftlichen Bereich gut mit den Begriffen Qualität und Sicherheit verbinden. Hier Glanzleistungen auf Basis von Befragungen unter Kunden, Mitarbeitern oder Lieferanten anzugeben, erfordert doch auch die genaue Angabe, welcher Gruppe welche Fragen gestellt wurden, d.h. welche Nominaldefinition zu Grunde gelegt wurde und welche Indikatoren herangezogen worden sind. Gerade in diesen beiden Fällen gibt es auch von diversen Standardisierungsgremien, die evtl. sogar für eine Branche (Medizin, Verkehrstechnik) angepasste Definitionen besitzen, sodass dann darauf aufbauend auch geeignete und ehrliche Indikatoren entwickelt werden sollten. Eine Werbung, „unsere Kunden halten uns für die Besten“ oder „Deutschland sagt: ihr seid die Nr. 1“ ist zwar sehr schön plakativ, bewegt sich aber auch im Graubereich des Erlaubten, wenn sie nicht schon durch fehlendes Mini-Sternchen am Text zur Einschränkung, dass nur Grundschulklassen ohne Produkterfahrung und mit der Bestechung durch kostenloses Wassereis an der Befragung teilgenommen haben, diese Grenze überschritten hat.
Hinweis: Die Messung der Kundenzufriedenheit ist übrigens in der ISO-Normen 9000ff geregelt, sodass also auch dieses Feld wenig Interpretationsspielraum lässt, wenn man eine entsprechende ISO-9000-Zertifizierung anstrebt.
In Unternehmen, die eine vertragliche und hier auch meist mehrjährige Geschäftsbeziehung mit ihren Kunden haben, ist es zwangsläufig interessant, möglichst früh zu erfahren, welche Kunden den Vertrag mit einer gewissen Wahrscheinlichkeit nicht verlängern werden. Insbesondere Telekommunikationsanbieter sind an dieser Zahl sehr interessiert und versuchen mittlerweile auch, entsprechende Sonderangebote vor dem Ende der Vertragslaufzeit zu unterbreiten, um den Wechsel zu verhindern. Unabhängig von der konkreten Nutzung der Untersuchungsergebnisse für eine Prognose und den Schluss von Stichprobe auf Grundgesamtheit ist es auch schon interessant für die reine Überlegung, wie man nun eigentlich diese Wechselneigung, das Kündigungsinteresse oder den Ablösungswunsch erkennen, d.h. messen kann. Möglicherweise ist auch in diesem Zusammenhang gar keine Befragung notwendig, um den Wechselwillen zu identifizieren, sondern sie würde vielmehr dem Zweck dienen, aus den schon vorhandenen Vertragsdaten in Zusammenhang mit weiteren kundenspezifischen Daten, die im Rahmen der Befragung unter vielleicht schon gewechselten Kunden erhoben werden, ein Muster abzuleiten, mit dem die Wechselneigung/-tendenz (also immer mit Bezug auf die Wahrscheinlichkeit) erkannt werden kann.
Die Auswahl an Variablen scheint zunächst sehr umfangreich:
In den drei genannten möglichen Variablen steckten selbst wieder einige andere Variablen, die sich zudem auch noch wechselseitig beeinflussten. Zunächst klar ist auf jeden Fall, dass das Phänomen Wechselneigung nicht direkt zu messen ist. Man benötigt also Variablen, die dies erlauben, und man kann sich darüber hinaus auch schon vorstellen, dass es eine ganze Reihe an möglichen Variablen gibt, die man sich auch wiederum als Einflussfaktoren mit verschiedenen Gewichtungen in einem ganzen Modell vorstellen kann. Auf der nächsten darunter liegenden Ebene lässt sich die Kundenzufriedenheit oder in diesem Fall das Nutzungsverhalten heranziehen. Die Kundenzufriedenheit ist immer interessant zu kennen und spielt natürlich auch in diesem Fall eine Rolle, doch die Begeisterung über die freundliche Beantwortung einer Frage am Service-Telefon wird vermutlich in der weitaus größten Anzahl der Fälle nicht über deutlich höhere Rechnungsbeträge als bei Freunden und Bekannten mit ähnlichem Nutzungsverhalten hinwegtrösten können.
Daher ist das Nutzungsverhalten als Einflussgröße und auch als Variable,
mit der die Wechselneigung gemessen oder wenigstens teilweise abgeschätzt
werden kann, zu verwenden. Wie man sieht, scheint es also auch noch
andere Variablen zu geben, welche das Phänomen der Wechselwirkung
beobachtbar, messbar und schließlich auch nach der Datenerhebung und
–auswertung prognostizierbar werden lassen. Als einfachste manifeste
Variable kann man nun wiederum den Umsatz heranziehen, der ja nun ohnehin
für die Rechnungsstellung direkt aus dem betrieblichen
Leistungserstellungsprozess ermittelt und über die gesamte Vertragsdauer
sowie darüber hinaus vorgehalten wird.
Der Umsatz kann drei Entwicklungen besitzen: steigen, fallen und gleich
bleiben. In der zusammenfassenden Abbildung sind lediglich die beiden
gegensätzlichen Entwicklungen „steigen“ und „fallen“ eingetragen. So kann
man sehr schön sehen, dass man auch eine scheinbar so leicht zu messende
nun endlich auch manifeste Variable wie den Umsatz noch weiter aufbrechen
muss, um zu sinnvollen Messergebnissen zu gelangen.

Ein trügerisches Zeichen wie der steigende Umsatz kann nämlich gerade darin begründet sein, dass sich das Nutzungsverhalten verändert hat und der Kunde daher in den für ihn wichtiger werdenden Leistungen einen höheren Verbrauch hat und nun höhere Kosten zu schultern hat, die bei einem Konkurrenzvertrag gerade nicht entstünden, da hier eine Flatrate im Angebot ist. Auch ein gleich bleibender Umsatz könnte nicht eine kontinuierlich gleiche Nutzung bedeuten, sondern in Wirklichkeit eine Umschichtung, die wiederum bei einem anderen Unternehmen zu besseren Konditionen ebenfalls zu finden wäre. Eine analoge Überlegung lässt sich nun auch für den sinkenden Umsatz anstellen, wobei dieser aufgrund der für das Unternehmen auch unangenehmen Bedeutung vermutlich auch früher auch als kritisch bemerkt würde. Vielleicht ist aber auch genau dies ein Grund für den Kunden, trotz geändertem Nutzungsverhalten den Vertrag zu verlängern, weil er ja trotz oder gerade wegen des geänderten Nutzungsverhaltens Kosten sparen kann. Genauso gut lässt sich aber hier anführen, dass dies in Wirklichkeit nur auf eine veränderte Preisstruktur zurückzuführen sei, an der man diesen Kunden auch hat teilhaben lassen, welche nun aber sein geändertes Nutzungsverhalten, das bei unveränderten Preisen zu einer Kostensteigerung geführt hätte, nur kaschiert.
Man sieht also, dass nun noch die Gründe für das geänderte Nutzungsverhalten fehlen, um es erstens zu klären, zweitens aber auch überhaupt zu messen. In diesem Beispiel kann man sich auch vorstellen, dass im Grunde genommen erst die Lebensumstände, welche das Nutzungsverhalten beeinflussen, die besten und verlässlichsten Variablen für die Wechselneigung sind und bereits alle anderen bislang diskutierten Variablen in Wirklichkeit selbst wieder zwar Teil des Phänomens, aber keine originäre Erklärung liefern. Als rein kundenbezogene Variablen lassen sich nun plötzlich wieder solche einfachen demographischen Merkmale wie das Alter (oder der Alterswechsel), der Zivilstand (oder der Wechsel in einen anderen Zivilstand) oder der Beruf (oder der Wechsel in einen anderen Beruf bzw. zu einem anderen Unternehmen, in eine andere Stadt oder eine andere Gehaltsklasse) auflisten. Das Nutzungsverhalten von Telefonie ist sehr eng verbunden mit der alltäglichen Lebensführung. Wenngleich vielleicht auch die Nutzung von SMS gegenüber Sprachtelefonie nicht so pauschal aus der aktuellen Lebenssituation abgeleitet werden kann, so kann dies aber mit der generellen Nutzung von mobiler Kommunikation geschehen. Jemand, der einfach von Montag bis Freitag nicht zuhause ist, weil er direkt beim Kunden im Projekt arbeitet, kann nun einmal seinen Festnetzanschluss nicht verwenden. Wenn er überhaupt telefonieren will, bleibt nur noch das Mobiltelefon übrig. Ob er dann zu der Gruppe von Kunden gehört, die das Zimmertelefon im Hotel oder das Firmen-Handy nutzen, kann dann in einer entsprechenden Befragung abschließend geklärt werden.
Schließlich ist man am Ende der gesamten Kette an Variablen angelangt und hat sich von einer latenten Variablen, die sich nicht direkt messen ließ, zu einer Reihe von manifesten vorgearbeitet. Sie standen auch wieder in einem Wechselwirkungsverhältnis und konnten auch hierarchisiert werden. Die vollständige Messung der Wechselneigung ist immer noch nicht möglich, aber eine möglicherweise entscheidende Variable scheint identifiziert zu sein.
Die beiden Beispiele haben schon gezeigt, dass man sich oft in der Entscheidungssituation befindet, aus einer Fülle von Indikatoren geeignete auszuwählen. Dies kann aufgrund von verschiedenen Faktoren erfolgen.

Man erkennt an diesen Überlegungen, dass man auch von einer Austauschbarkeit der Indikatoren ausgehen kann. Es steht nicht nur überhaupt eine Auswahl an Indikatoren zur Verfügung, sondern man kann auch prinzipiell den einen Indikator gegen den anderen austauschen. Es ist zwar nicht gesagt, dass die Qualität der Aussage des einen mit der eines anderen Indikators gleichzusetzen ist, doch lässt sich sicherlich auch immer eine gute oder sogar gleichwertige Alternative finden. In diesem Zusammenhang werden die beiden Begriffe Indikatorenuniversum und multiple Indikatoren verwendet. Das Indikatorenuniversum beschreibt die zur Verfügung stehende Menge an Indikatoren für eine Eigenschaft, wobei diese Menge vollständig ist und die einzelnen Indikatoren auch tatsächlich die gleiche Messqualität haben. Sie sind also gegeneinander derart austauschbar, dass man quasi eine zufällige Auswahl an einzelnen Indikatoren verwenden könnte, um eine Messung durchzuführen. Diese unabhängigen Messungen der Eigenschaft, welche durch die Indikatoren ermöglicht werden, sind als Homogenität des Indikatorenuniversums bekannt. Durch die Austauschbarkeit der Indikatoren kann man sich darauf verlassen, dass man eine korrekte Messung erhält und darüber hinaus eine Messung mit mehreren Indikatoren sogar das gleiche Ergebnis liefert, was genau mit dem Konzept der multiplen Indikatoren gemeint ist.
Dies ist natürlich als allgemeines Konzept sehr interessant, aber leider nicht nachweisbar bzw. aufgrund der meist diffizilen Phänomene, die zu messen sind, nicht immer auch in der Praxis so zu beobachten. Eher ist es so, dass die Auswahl von geeigneten Indikatoren schon eine Hürde darstellt, geschweige dann noch sicherzustellen, dass die konkrete Auswahl von mehreren Indikatoren die Eigenschaft besitzt, dass sie alle austauschbar sind. Vielmehr ist es notwendig, für die meisten Fragestellungen in einer Befragung, welche ja schließlich Fragen nach Indikatoren sind, auch Kontrollfragen zu besitzen, die die gleiche Eigenschaft mal von der einen und mal von der anderen Seite aus betrachten. Hierbei geht man davon aus, dass man keine so exakte Antwort erhält, sondern immer auch aus verschiedenen Gründen (vergessener korrekter Eigenschaftswert, über- oder untertriebener bekannter Wert, verheimlichter oder gerade hervorgehobener tatsächlicher Wert) eine ungenaue Antwort erhält. Zusätzlich muss man sich vor Augen führen, dass man nicht immer an der tatsächlichen Antwort an sich interessiert ist, sondern dass sie durch Interpretation oder in Zusammenhang mit anderen Antworten Rückschlüsse auf ungefragte Themen bieten kann.
Man muss immer davon ausgehen, dass sowohl durch zufällige wie auch systematische Messfehler nicht die korrekten Werte ermittelt worden sind. Hier hofft man dann, dass die Abweichungen sich gegenseitig aufheben, wenn mehrere Indikatoren für die gleiche Eigenschaft herangezogen werden. Wenn die Indikatoren also unabhängig voneinander sind, dann können die Messfehler auch unabhängig voneinander schwanken und sich ein Ausgleich der Messfehler ergeben. Wenn man dagegen erwartet, dass gerade die Messfehler systematisch schwanken, dann kann man nur durch zusätzliche Indikatoren, mit denen die systematische Schwankung geschätzt werden kann, den vermutlich korrekten Wert ermitteln.
