Das erste Bild. Im zweiten guckt der Mensch nicht gerade aus, sondern auf sein Handy/Smartphone. Damit ist er für mich quasi nicht mehr in der Situation.
Im ersten Bild dagegen nimmt sein Blick die Richtung der Treppe von links oben nach links unten auf. Warum auch immer, aber so wirkt die Person als "in der Situation".
Das Beschneiden würde ich nicht so massiv vornehmen. Denn gerade das "er" nur ein so kleiner Teil der Szenerie ist, macht es hier für mich aus. Die Vignetierung rechts oben habe ich fast als absichtliche Dunkelheit gewertet, so im Sinne von - Der Mensch schaut nach unten und hinten ins abgeschattete und der Ausweg ist das hellere links oben.