A diftongusoknak bár létjogosultságát nem kérdőjelezik meg a tudósok, mégis fonetikai és fonológiai státusa meglehetősen problémás. A viták a diftongusok mibenlétéről az idők folyamán változtak. A koraiak arról szóltak, hogy egy hang-e a diftongus. Egyesek szerint „két álló és egy sikló hang kapcsolata, mások úgy vélték, hogy két magánhangzó egyszótagos kapcsolata.”
Továbbá az is kérdéses volt, hogy két magánhangzó kapcsolata-e (diftongus- kettőshangzó). Volt, aki a diftongus „nyitó-” vagy „záróhangját” nem tekintette magánhangzónak, hanem mássalhangzónak, esetleg szemivokálisnak, azaz félhangnak/simulóhangnak (gyengédebb nyomatékú hangszakasz). A magyar nyelvben érdekesek a kettős mássalhangzók, melyek írásban is megjelennek (gy, ty, dz, stb.) Ezeknél „az összetevőket nem feltétlenül észleljük külön egységként, hanem csupán az együttesük által keltett, egységes hangjelenséget fogjuk fel.”