Haastattelu Kysymykset

65 parasta Apache Kafka -haastattelun kysymystä ja vastausta

30. lokakuuta 2021

Apache Kafkasta on tullut suosittu valinta tietojenkäsittelyn työmahdollisuuksia etsivien ammattilaisten keskuudessa.

Tämä artikkeli on koonnut kuuluisimmat Apache Kafka -haastattelukysymykset ja -vastaukset sekä aloittelijoille että kokeneemmille, jotta voit vastata Apache Kafka -haastattelukysymyksiin.

Sisällysluettelo

K.1 Mikä Apache Kafka on?

Kafka on Apache-ohjelmiston kehittämä avoimen lähdekoodin viestinvälityssovellus. Se on kirjoitettu Scalassa ja on hajautettu julkaisu-tilaa -viestijärjestelmä. Kafka kommunikoi asiakkaan ja palvelimen välillä käyttämällä tehokasta, yksinkertaista, kieliagnostista TCP-protokollaa.

K. 2 Ota kaikki osat mukaan Kafkaan.

Kafkassa on neljä pääkomponenttia:

yksi. Aihe – samantyyppinen viestivirta tai kokoelma

kaksi. Tuottaja - jotka julkaisevat viestejä

3. Välittäjät – Kafka-palvelin, johon julkaistut viestit on tallennettu

Neljä. Kuluttajat – jotka tilaavat aiheita ja hakevat tietoja välittäjiltä.

K. 3 Mikä on offset?

Yksinkertainen kokonaisluku, joka on määritetty säilyttämään nykyisen kuluttajan asema, on Offset. Viimeisin Kafkan kuluttajalle lähettämä ennätys viimeisimmässä kyselyssä on nykyinen offset.

Katso myös Top 100 JavaScript-haastattelun kysymystä ja vastausta

K. 4 Millä kielellä Kafka Apache -ohjelmisto on kirjoitettu?

Kafka on kirjoitettu kahdella ohjelmointikielellä – Scalalla ja Javalla.

K. 5 Selitä offsetin rooli.

Offset määritellään peräkkäisenä ID-numerona, joka annetaan viesteille, jotka helpottavat niiden yksilöllistä tunnistamista osiossa.

K. 6 Mikä on kuluttajaryhmä?

Kafka-kuluttajaryhmä on erityinen kuluttajaryhmä Kafka-kuluttajista, jotka ovat tilaaneet samat aiheet. Tämä konsepti on yksinomaan Apache Kafka.

K. 7 Onko mahdollista käyttää Kafkaa ilman Zookeeperia?

Ei. Emme voi ohittaa Zookeeperia muodostaaksemme yhteyden suoraan Apache Kafkaan.

K. 8 Mitä Zookeeper-palvelin tekee Kafkassa?

Eläintarhanhoitajapalvelin on vastuussa koordinaation rakentamisesta useiden klusterin sisällä olevien solmujen välille ja aiemmin tehdyn poikkeaman palauttamisesta, kun jokin solmu epäonnistuu.

K. 9 Mitä tiedät Kafkan osioista?

Kafka-välittäjällä on muutama osio, joista jokainen voi olla joko aiheen kopio tai johtaja.

K. 10 Mitä eroa on Kafka-klusterin aiheen osion ja replikan välillä?

Osio on yksittäinen osa Kafkan aihetta, joka auttaa rinnakkaisuudessa, kun luemme kysymyksiä. Ne määrittävät Kafka-kuluttajaryhmän kuluttajien määrän, tiedontuotannon ja kulutussuhteen.

Replika on osion kopio, johon ei voi kirjoittaa tai lukea. Ne luovat tietojen redundanssia, mikä tarkoittaa, että aiheen n replikan kohdalla n-1 välittäjää voi epäonnistua ennen tietojen häviämistä.

Parhaat Apache Kafka -haastattelukysymykset ja vastaukset

K. 11 Miksi Kafka-teknologian käyttö on tärkeää?

Kafkan edut ovat:

  • Korkea suorituskyky, joten suuria laitteistoja ei tarvita,
  • Skaalautuvuus, joka vähentää seisokkeja sallimalla solmujen lisäämisen lennossa,
  • Kestävyys tukemalla viestin replikointia,
  • Vikasietoisuus, koska Kafka-solmut kestävät klusterin sisällä tapahtuvia vikoja, ja
  • Matala latenssi, jotta voidaan käsitellä viestejä millisekuntien viiveellä.

K. 12 Mikä on Kafka-klusterin aiheen osio?

Yksi Kafka-aihe on osio, ja osioiden määrä määritetään aihekohtaisesti.

K. 13 Mikä on Kafkan aihe?

Tietueiden julkaisemiseen tarkoitettua syötteen nimeä tai luokkaa kutsutaan aiheeksi, ja jokaista aihetta ylläpidetään osioiduissa Kafkan lokeissa. Aiheilla voi olla nolla, yksi tai useita tilaajia kuluttajien perusteella.

K. 14 Mitkä ovat Kafkan tärkeimmät API:t?

Kafkalla on neljä ydinsovellusliittymää: Kafka Producer API, Connector API, Streams API ja Consumer API.

K. 15 Mitä ovat kuluttajat tai käyttäjät?

Jokainen Kafka-aiheen tilaaja on kuluttaja, joka osaa lukea ja käsitellä viestejä. Tietue julkaistaan ​​ja toimitetaan sen tilaavalle tietylle kuluttajaryhmälle kaikista kuluttajatapauksista.

K. 16 Selitä johtajan ja seuraajan käsite.

Johtajan ja seuraajan käsite on melko yksinkertainen. Kafka-keskuspalvelin toimii johtajana ja muut palvelimet ovat seuraajia.

K. 17 Mikä takaa Kafkan palvelimen kuormituksen tasapainottamisen?

Jos johtaja ei pysty suorittamaan luku- ja kirjoituspyyntöjä, yksi seuraajista ottaa haltuunsa ja suorittaa palvelimien kuormituksen tasapainotuksen.

K. 18 Luettele joitain Apache Kafkan käyttötapauksia?

Apache Kafkalla on seuraavat käyttötapaukset:

  • Seuranta ja kirjaaminen
  • Tapahtumavirrat
  • Viestijono

Q.19 Mitä rooleja replikoilla ja ISR:llä on?

Replikot ovat luettelo solmuista, jotka replikoivat lokin tietylle osiolle riippumatta siitä, ovatko ne johtajat vai eivät. Samaan aikaan ISR- tai In-Sync-kopiot ovat joukko viestikopioita, jotka on synkronoitu johtajiin.

K. 20 Miksi replikaatiot ovat tärkeitä Kafkassa?

Replikointi varmistaa, että julkaistut viestit eivät katoa, ja niitä voidaan käyttää mahdollisten vikojen, toistuvien ohjelmistopäivitysten, ohjelmavirheiden tai konevirheiden sattuessa.

Parhaat Apache Kafka -haastattelukysymykset ja vastaukset

K. 21 Jos replika pysyy ISR:n ulkopuolella pitkään, mitä se tarkoittaa?

Se tarkoittaa, että johtajalla on dataa kertynyt nopeammin kuin seuraajan hakudatanopeus.

K. 22 Mikä on Kafka-palvelimen käynnistämisprosessi?

Meidän on ensin käynnistettävä Zookeeper hakemistosta bin/zookeeper-server-start.sh config/zookeeper.properties.

Nyt Kafka-palvelin käynnistetään hakemistosta bin/Kafka-server-start.sh config/server.properties.

K. 23 Selitä mikä osiointiavain on?

Osiointiavainta käytetään viestiosion vahvistamiseen ja sen ohjaamiseen kohteeseen käyttämällä osion ID:tä hajautuspohjaisen osion avulla.

Q. 24 Milloin QueueFullException esiintyy Producer API:ssa?

Kun viestivälittäjät eivät pysty käsittelemään tuottajan lähettämien viestien ylivuotoa, tapahtuu QueFullException. Jotta poikkeus ei toistu, on käytettävä useita välittäjiä, koska tuottajilla ei ole rajoituksia.

K. 25 Selitä Kafka Producer API:n rooli.

Sitä käytetään tuottajatoimintojen suorittamiseen käyttämällä yhtä API-kutsua asiakaspyyntöön yhdistämällä Kafka.producer.async.Async Producer- ja Kafka.producer.SyncProducer-ponnistelut.

Katso myös 100 parasta haastattelukysymystä ja vastausta

K. 26 Mikä on tärkein ero Kafkan ja Flumen välillä?

Vaikka molemmat ovat reaaliaikaisia ​​prosessointiohjelmistoja, tärkein ero Kafkan ja Flumen välillä on se, että Kafka on skaalautuvampi ja kestävämpi viestinnässä.

K. 27 Onko Apache Kafka hajautettu suoratoistoalusta? Jos kyllä, mitä sillä voi tehdä?

Kafka on hajautettu suoratoistoalusta, jonka avulla voimme tallentaa paljon tietueita ilman tallennusongelmia, työntää tietueita nopeasti ja käsitellä tietueita reaaliajassa.

K. 28 Mitä voit tehdä Kafkan kanssa?

Kafkan avulla voimme suorittaa tiedonsiirron kahden järjestelmän välillä käyttämällä reaaliaikaista dataputkia ja rakentaa reaaliaikaisen suoratoistoalustan.

K. 29 Selitä Kafka-arkkitehtuuri?

Kafka on hajautettu järjestelmä, joka sisältää useita välittäjiä ja aiheita, joista jokainen sisältää useita osioita. Tämän avulla tuottajat ja kuluttajat voivat vaihtaa viestejä samanaikaisesti ja mahdollistaa saumattoman toteutuksen.

K. 30 Mikä on Kafka-klusterin säilytysajan tarkoitus?

Kafka-klusterit myyvät kaikki julkaistut tietueet vähittäiskaupassa riippumatta siitä, onko ne kulutettu vai ei. Kokoonpanonhallinta-asetuksen säilytysaikaa käytetään näiden sanomien hylkäämiseen vapaan tilan luomiseksi klusteriin.

Parhaat Apache Kafka -haastattelukysymykset ja vastaukset

K. 31 Mitkä ovat pääkomponentit, joissa tietoja käsitellään saumattomasti Kafkassa?

Kafkan tiedot käsitellään saumattomasti Tuottajat ja Kuluttajat.

K. 32 Selitä, kuinka voit saada Kafkalta täsmälleen kerran viestejä tietojen tuotannon aikana?

Vältä päällekkäisyyksiä tiedonkulutuksen ja tuotannon aikana, voit saada Kafkalta täsmälleen kerran viestit. Tiedontuotannossa, jos käytät yhtä kirjoittajaa osiota kohden ja sisällytät viestiin ensisijaisen avaimen, voit varmistaa täsmälleen yhden semantiikan.

K. 33 Mikä Kafka-viesti on?

Tavutaulukoita, joita kehittäjät käyttävät objektien tallentamiseen Avro-, String- tai JSON-muodoissa, kutsutaan Kafka-viesteiksi.

K.34 Selitä viestin enimmäiskoko, jonka Kafka voi vastaanottaa?

Kafka voi vastaanottaa enintään 1 000 000 tavua viestejä.

K. 35 Millaisia ​​ovat perinteiset sanomansiirtomenetelmät?

Perinteistä viestintätekniikkaa on kahta tyyppiä:

Jonotus: Tässä menetelmässä yhden tai useamman kuluttajan joukko lukee palvelimelta viestin, joista jokainen lähetetään yhdelle heistä.

Julkaise ja tilaa: Viestit lähetetään kaikille kuluttajille.

K. 36 Mitä ISR tarkoittaa Kafkan ympäristössä?

In Sync -kopiot tai ISR ​​ovat joukko viestikopioita, jotka synkronoidaan johtajiksi.

K. 37 Onko Apache Kafka avoimen lähdekoodin stream-käsittelyalusta.

Kyllä, Apachen Kafka on avoimen lähdekoodin stream-käsittelyalusta.

K. 38 Mikä on georeplikointi Kafkassa?

Kafka käyttää MirrorMakeria viestikopioiden luomiseen useisiin palvelinkeskuksiin ja pilvialueisiin käytettäväksi aktiivisina/passiivisina varmuuskopioina, tukee tietojen paikkausvaatimuksia ja sijoittaa tiedot lähemmäs käyttäjiä.

K. 39 Mikä viestivälittäjä on?

Se on palvelin, joka tallentaa julkaisijoiden viestejä.

K. 40 Kafka-järjestelmän kohokohtia?

Kafka tarjoaa:

  • Korkea suorituskyky
  • Alhainen viiveaika
  • Skaalautuva tallennustila

Parhaat Apache Kafka -haastattelukysymykset ja vastaukset

K. 41 Selitä monivuokraus?

Multi-vuokraus on Kafka-ratkaisu, joka voi konfiguroida aiheita tiedon tuottamiseen ja kulutukseen sekä kiintiötuen tarjoamiseen.

K. 42 Mikä on kuluttajasovellusliittymän rooli?

Kuluttajasovellusliittymien avulla sovellukset voivat tilata yhden tai useamman aiheen ja käsitellä tuotettuja tietueita.

K. 43 Mitä serDes tarkoittaa Apache kafkassa?

SerDes tai serializer deserializer tarjotaan tietueille jokaiselle Kafka-virralle ja materialisoi tallennettujen arvojen tiedot aina tarvittaessa.

K. 44 Selitä Streams API:n rooli?

Streams API:n avulla sovellukset voivat toimia suoratoistoprosessorina ja kuluttaa syötevirtoja yhdestä tai useammasta aiheesta tulosvirran tuottamiseksi.

K. 45 Mikä on Connector API:n rooli?

Connector API auttaa rakentamaan uudelleenkäytettäviä tuottajia ja kuluttajia ja ajaa niitä yhdistämään Kafka-aiheisiin olemassa oleviin tietojärjestelmiin tai sovelluksiin.

K. 46 Selitä tuottaja?

Tuottajat julkaisevat tiedot valitsemistaan ​​aiheista ja valitsevat aiheista tietueet, jotka määritetään osioihin.

K. 47 Kuinka voit lähettää suuria viestejä Kafkan avulla (yli 15 Mt)?

Suurten, eli yli 15 megatavun viestien lähettämiseksi kolmea tai neljää ominaisuutta on säädettävä:

    Välittäjä puoli– message.max.bytes ja replica.fetch.max.bytesVälittäjäpuoli aiheittain– max.message.bytes.Kuluttajan puoli– fetch.message.max.bytes

K. 48 Vertaa: RabbitMQ vs Apache Kafka

RabbitMQ on Kafkan vaihtoehtoinen ohjelmisto, jonka suorituskyky on 20 000 viestiä sekunnissa. Toisin kuin RabbitMQ, Kafka on kuitenkin kestävämpi, erittäin saatavilla oleva ja hajautettu, mikä mahdollistaa tietojen jakamisen ja replikoinnin. Lisäksi Kafkan suorituskyky on 100 000 viestiä sekunnissa.

K. 49 Vertaa: Perinteiset jonojärjestelmät vs. Apache Kafka

Perinteiset jonojärjestelmät poistavat viestit jonon lopusta, kun käsittely on valmis. Ne eivät salli logiikan käsittelyä samankaltaisten viestien tai tapahtumien perusteella.

Katso myös Top 100 JavaScript-haastattelun kysymystä ja vastausta

Toisaalta Apache Kafka ei poista viestejä, kun kuluttaja on vastaanottanut ne ja sallii viestien säilymisen. Se mahdollistaa logiikan käsittelyn samankaltaisten tapahtumien tai viestien perusteella.

K. 50 Miksi meidän pitäisi käyttää Apache Kafka Clusteria?

Apache Kafkalla on seuraavat edut:

  • Se voi voittaa suurten tietomäärien keräämisen ja analysoinnin haasteet.
  • Se voi luoda hälytyksiä ja raportoida toimintamittareita.
  • Se mahdollistaa aiheiden suoratoistodatan jatkuvan käsittelyn.
  • Se voi muuntaa tiedot vakiomuotoon.
  • Se seuraa verkkotoimintaa tallentamalla tai lähettämällä tapahtumia reaaliaikaisia ​​prosesseja varten.

Parhaat Apache Kafka -haastattelukysymykset ja vastaukset

K. 51 Mikä Kafka-klusteri on?

Kaikki julkaistut tietueet, riippumatta siitä, kulutetaanko niitä vai ei, ovat hyödyllisiä klusterissa, joka käyttää konfiguroitavaa säilytysaikaa.

K. 52 Selitä termi Log Anatomia.

Apache Kafkan haastattelukysymykset

Lokit ovat osioita, joihin tietolähde kirjoittaa viestejä. Yksi tai useampi kuluttaja voi milloin tahansa lukea lokeista.

Yllä oleva kaavio osoittaa, että tietolähde kirjoittaa lokin ja kuluttajat lukevat sen eri poikkeamilla.

K. 53 Mitä vaihtoehtoja Apache Kafkalle on?

Kafka on paras ja laajalti käytetty kaikista vaihtoehdoistaan, kuten RabbitMQ, Active MQ, ZeroMQ jne.

K. 54 Selitä, kuinka Kafka viritetään optimaaliseen suorituskykyyn.

Kafkaa voidaan virittää virittämällä sen eri komponentteja, kuten:

  • Kafkan kuluttajien virittäminen
  • Kafka välittäjien viritys
  • Kafkan tuottajien viritys

K. 55 Apache Kafkan valtion haitat.

Jotkut Apache Kafkan haitoista ovat:

  • Ongelmia viestien säätämisessä
  • Vauhdin puute
  • Ei täydellistä seurantatyökalusarjaa
  • Jokerimerkki-aihevalintaa ei tueta

K. 56 Mitkä ovat Kafka-tekniikan edut?

Jotkut Kafkan eduista ovat:

  • Kafka on nopea ja sisältää välittäjiä, joista jokainen pystyy käsittelemään megatavuja dataa.
  • Se on vankka
  • Siinä on hajautettu muotoilu
  • Se on skaalautuva ja kestävä
  • Suuri tietojoukko voi auttaa analysoimaan paremmin.

Q. 57 Ota kaikki Apache Kafka -operaatiot mukaan.

Apache Kafka suorittaa seuraavat toiminnot:

  • Erityinen sammutus
  • Palvelimet ja datakeskukset poistuvat käytöstä
  • Datan peilaus klusterien välillä
  • Kafka-aiheiden lisääminen ja poistaminen
  • Kuluttajan aseman löytäminen
  • Automaattinen tietojen siirto

K. 58 Selitä Apache Kafkan käyttötapaukset?

Apache Kafkan haastattelukysymykset

Yllä olevasta käyttötapauksesta voimme nähdä, että Kafkalla on pääasiassa kolme käyttötapausta:

Kafka-mittarit: Se mahdollistaa Kafkan käytön operatiivisten tietojen seurantaan ja keskitettyjen syötteiden tuottamiseen käyttötietojen avulla.

Kafka lokin yhdistäminen: Se kerää lokeja useista organisaation järjestelmistä ja palveluista.

Striimin käsittely: Kafka on kestävä ja siksi hyödyllinen virrankäsittelyssä.

Q. 59 Jotkut Kafkan merkittävimmistä sovelluksista.

Netflix, Oracle ja Mozilla ovat eräitä Kafkan merkittävimmistä sovelluksista.

Parhaat Apache Kafka -haastattelukysymykset ja vastaukset

Q. 60 Kafka Streamin ominaisuudet.

Kafkassa on seuraavat ominaisuudet:

  • Virrat ovat vikasietoisia ja erittäin skaalautuvia, ja ne ovat yhtä käyttökelpoisia pienissä, keskisuurissa ja suurissa käyttötapauksissa.
  • Voit kirjoittaa tavallisia Java-sovelluksia.
  • Kafkaa voidaan ottaa käyttöön pilvessä, virtuaalikoneissa, konteissa ja paljaalla metallilla.
  • Siinä on vain yksi käsittelysemantiikka.
  • Se on täysin integroitu Kafka-tietoturvaan.

K. 61 Mikä on Javan merkitys Apache Kafkassa?

Java-kieltä käytetään Kafkassa korkean käsittelynopeuden ja hyvän yhteisön tuen tarjoamiseen.

Q. 62 Mainitse yksi Kafkan paras ominaisuus.

Monipuolinen käyttötapa on Kafkan paras ominaisuus. Kafka hallitsee useita datajärvelle yleisiä käyttötapauksia.

Q. 63 Selitä termi Topic Replication Factor.

Aiheen replikaatiot ovat olennainen näkökohta, joka tulee ottaa huomioon suunniteltaessa Kafka-järjestelmää. Siten, jos välittäjä jostain syystä kaatuu, muut jäljennökset voivat korvata sen.

K. 64 Selitä joitain Kafka Streamsin reaaliaikaisia ​​käyttötapauksia.

Jotkut reaaliaikaisista käyttötapauksista ovat:

LINJA: LINE-sovellus käyttää huoltoon keskitettyä datakeskusta.

New York Times: Kafka on tottunut tallentamaan ja jakamaan tietoja reaaliajassa.

Lataukset: Se käyttää yrityspalveluväylää (ESB) ylläpitääkseen online-muotikauppiaita.

K. 65 Mitä Kafka takaa?

Jotkut Kafkan takuista ovat:

  • Kuluttaja näkee tietueet samassa järjestyksessä kuin lokiin tallennetut tietueet.
  • Kafka voi sietää jopa N-1 palvelinvikoja menettämättä lokiin sitoutuneita tietueita.
  • Tuottajan lähettämien viestien tilaus ANTAA POTKUT on sama tietylle aihealueelle.

Johtopäätös

Toivomme, että artikkelimme aiheesta Apache Kafka haastattelukysymykset voivat auttaa sinua saavuttamaan Kafka-haastattelusi.

Voit myös katsoa Kafka-opetusohjelman ymmärtääksesi paremmin Apache-ohjelmistosäätiön kehittämän Kafka-ohjelmiston.