<div dir="ltr">We are investigating the same issue on our side, I'm trying some other tests to figure out why the references aren't working as expected.</div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Sep 7, 2023 at 1:27 PM Chhabra, DipinderSingh <<a href="mailto:Dipinder.Chhabra@dell.com">Dipinder.Chhabra@dell.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="msg-3000132491391917046">





<div lang="EN-US" style="overflow-wrap: break-word;">
<div class="m_-3000132491391917046WordSection1">
<p class="MsoNormal">Yes.<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(225,225,225);padding:3pt 0in 0in">
<p class="MsoNormal"><b>From:</b> William Kennington <<a href="mailto:wak@google.com" target="_blank">wak@google.com</a>> <br>
<b>Sent:</b> Thursday, September 7, 2023 2:55 PM<br>
<b>To:</b> Chhabra, DipinderSingh <Dipinder_Chhabra@Dell.com><br>
<b>Cc:</b> <a href="mailto:openbmc@lists.ozlabs.org" target="_blank">openbmc@lists.ozlabs.org</a><br>
<b>Subject:</b> Re: phosphor-network terminated due to SIGBUS<u></u><u></u></p>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<p><span style="color:rgb(206,17,38)">[EXTERNAL EMAIL] <u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal">Do you happen to be using aarch64?<u></u><u></u></p>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal">On Thu, Sep 7, 2023 at 12:52 PM Chhabra, DipinderSingh <<a href="mailto:Dipinder.Chhabra@dell.com" target="_blank">Dipinder.Chhabra@dell.com</a>> wrote:<u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0in 0in 0in 6pt;margin:5pt 0in 5pt 4.8pt">
<div>
<div>
<div>
<p class="MsoNormal">Hi There<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">Recently we updated our OpenBMC distro to tag 2.14.0 (phosphor-network SRCREV f78a415e154bac274e1d07ce8128c69e9d1cd710).<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">Since then we are seeing that the phosphor-network service crashes after configuration change due to SIGBUS.<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<pre><span style="color:black">Sep 07 09:51:45 bmc phosphor-network-manager[627]: Wrote networkd file: /etc/systemd/network/00-bmc-end1.network</span><u></u><u></u></pre>
<pre><span style="color:black">Sep 07 09:51:45 bmc phosphor-network-manager[627]: Wrote networkd file: /etc/systemd/network/00-bmc-end0.network</span><u></u><u></u></pre>
<pre><span style="color:black">Sep 07 09:51:49 bmc systemd[1]: xyz.openbmc_project.Network.service: Main process exited, code=dumped, status=7/BUS</span><u></u><u></u></pre>
<pre><span style="color:black">Sep 07 09:51:49 bmc systemd[1]: xyz.openbmc_project.Network.service: Failed with result 'core-dump'.</span><u></u><u></u></pre>
<pre><span style="color:black">Sep 07 09:51:49 bmc systemd[1]: xyz.openbmc_project.Network.service: Consumed 1.365s CPU time.</span><u></u><u></u></pre>
<pre><span style="color:black">Sep 07 09:51:50 bmc systemd[1]: xyz.openbmc_project.Network.service: Scheduled restart job, restart counter is at 1.</span><u></u><u></u></pre>
<pre><span style="color:black">Sep 07 09:51:50 bmc systemd[1]: Stopped Phosphor Network Manager.</span><u></u><u></u></pre>
<pre><span style="color:black">Sep 07 09:51:50 bmc systemd[1]: xyz.openbmc_project.Network.service: Consumed 1.365s CPU time.</span><u></u><u></u></pre>
<pre><span style="color:black">Sep 07 09:51:50 bmc systemd[1]: Starting Phosphor Network Manager...</span><u></u><u></u></pre>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">Based on my debugging, I can confirm that the timer gets scheduled correctly after the config write and the registered call back does get invoked. The crash happens due to the below
 dbus call in network_manager.cpp.<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">        try</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">        {</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">            bus.get()</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">                .new_method_call("org.freedesktop.network1",</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">                                 "/org/freedesktop/network1",</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">                                 "org.freedesktop.network1.Manager", "Reload")</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">               
<span style="color:black;background:yellow">.call();</span></span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">            lg2::info("Reloaded systemd-networkd");</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Courier New"">        }</span><u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">I have looked into any fixes to this in the later commits but do not find any.<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">I also tried to change it to call_noreply but that does not help and get the same BUS error.<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<pre><span style="color:black">        try</span><u></u><u></u></pre>
<pre><span style="color:black">        {</span><u></u><u></u></pre>
<pre><span style="color:black">            lg2::info("Try systemd-networkd reload...");</span><u></u><u></u></pre>
<pre><span style="color:black">            auto method = bus.get().new_method_call(NETWORKD_BUSNAME, NETWORKD_PATH,</span><u></u><u></u></pre>
<pre><span style="color:black">                                 NETWORKD_INTERFACE, "Reload");</span><u></u><u></u></pre>
<pre><span style="color:black">            bus.get().call_noreply(method);</span><u></u><u></u></pre>
<pre><span style="color:black">            lg2::info("Reloaded systemd-networkd");</span><u></u><u></u></pre>
<pre><span style="color:black">        }</span><u></u><u></u></pre>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">When I manually invoke this from the shell that seems to go fine.<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<pre><span style="color:black">root@bmc:~# busctl call org.freedesktop.network1 /org/freedesktop/network1 org.freedesktop.network1.Manager Reload                                            </span><u></u><u></u></pre>
<pre><span style="color:black">root@bmc:~# echo $?</span><u></u><u></u></pre>
<pre><span style="color:black">0</span><u></u><u></u></pre>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">Anyone else seeing this issue with phosphor-network or any idea why this could be happening?<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">Thanks<u></u><u></u></p>
<p class="MsoNormal">Dip<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p style="margin:0in"><span style="font-size:7pt;color:rgb(115,115,115)">Internal Use - Confidential</span><u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="m_-3000132491391917046msipfooter90245289" style="margin:0in"><span style="font-size:7pt;color:rgb(115,115,115)">Internal Use - Confidential</span><u></u><u></u></p>
</div>
</div>
</div>
</blockquote>
</div>
</div>
</div>

</div></blockquote></div>