Węzły wejściowe i wyjściowe grafu obliczeniowego to te, które łączą się bezpośrednio z danymi wejściowymi x i danymi wyjściowymi y. Kodowanie danych wejściowych jest zwykle proste, przynajmniej w przypadku danych rozkładanych na czynniki, gdzie każdy przykład uczący zawiera wartości dla n atrybutów wejściowych. Jeśli atrybuty są logiczne, mamy n węzłów wejściowych; zwykle fałsz jest mapowany na wejście 0, a prawda jest mapowana na 1, chociaż czasami używane są -1 i +1. Atrybuty numeryczne, zarówno całkowite, jak i rzeczywiste, są zwykle używane bez zmian, chociaż mogą być skalowane tak, aby mieściły się w ustalonym zakresie; jeśli wielkości dla różnych przykładów różnią się ogromnie, wartości można odwzorować na skalę logarytmiczną. Obrazy nie do końca pasują do kategorii danych faktoryzowanych; chociaż obraz RGB o rozmiarze X x Y pikseli można traktować jako atrybuty o wartościach całkowitych 3XY (zazwyczaj z wartościami w zakresie {0,…,255}), to zignoruje to fakt, że tryplety RGB należą do tego samego piksela na obrazie i fakt, że sąsiedztwo pikseli naprawdę ma znaczenie. Oczywiście możemy mapować sąsiednie piksele na sąsiednie węzły wejściowe w sieci, ale znaczenie sąsiedztwa zostaje całkowicie utracone, jeśli wewnętrzne warstwy sieci są w pełni połączone. W praktyce sieci używane z danymi obrazu mają wewnętrzne struktury przypominające tablice, które mają na celu odzwierciedlenie semantyki sąsiedztwa. Zobaczymy Atrybuty kategorialne z więcej niż dwiema wartościami – na przykład atrybut Type w problemie z restauracją , który ma wartości francuskie, włoskie, tajskie lub burgerowe) – są zwykle kodowane przy użyciu tak zwanego kodowania one-hot. Atrybut o d możliwych wartościach jest reprezentowany przez d oddzielnych bitów wejściowych. Dla dowolnej danej wartości odpowiedni bit wejściowy jest ustawiany na 1, a wszystkie pozostałe na 0. Zwykle działa to lepiej niż mapowanie wartości na liczby całkowite. Gdybyśmy użyli liczb całkowitych dla atrybutu Type, Thai miałby wartość 3, a burger byłby 4. Ponieważ sieć jest złożeniem funkcji ciągłych, nie miałaby innego wyjścia, jak zwrócić uwagę na sąsiedztwo liczbowe, ale w tym przypadku na sąsiedztwo liczbowe między Tajska i burgerowa jest semantycznie bez znaczenia.